没有人觉得B站的搜索很难用吗? | 您所在的位置:网站首页 › ae8686视频分区 › 没有人觉得B站的搜索很难用吗? |
没有人觉得B站的搜索很难用吗?— 怎么用Tableau(数据可视化)帮助饭圈女孩磕CP
前言
提到数据可视化,大部分朋友可能会联想到公司决策,商业洞见等等很高大上的关键词,但其实数据可视化软件也可以用来做一些更接地气更有趣的事情。 最近我就试着用Tableau改善了一下自己的B站视频搜索体验,帮助饭圈女孩们更快乐的磕CP。 虽然是很剑走偏锋的用法,但是整个过程(确定需求 -> 获取/设计数据 -> 根据需求和执行方式设计可视化仪表盘)与商用的可视化是很类似的,希望对想要用Tableau做些什么的朋友们有一点的参考价值。 【我做的B站视频过滤器】 地址:https://public.tableau.com/profile/eris5000#!/vizhome/B_15697996268790/Bpublic PS: 这个过滤器并没有用到很高大上的图表,如果朋友们有任何问题,评论,改善建议或意见,欢迎互动~ 不混二次元的朋友们也许对B站比较陌生,还有些朋友可能平常不怎么用到Tableau,这一节会非常简单的介绍一下B站和Tableau这个数据可视化工具。当然都比较了的朋友们请跳过这一部分。 1.1 什么是Tableau?Tableau是一款BI(Business Intelligence)软件,通过数据可视化帮助决策。并且还扩展了辅助数据准备的Tableau Prep,以及实现云端共享的Tableau Online/Server等。 1.2 什么是B站?B站是哔哩哔哩的昵称,是国内领先的年轻人文化社区和视频网站。一开始主要是二次元的集聚地,同时影视剪辑(影视二次创作同人作品)作品水平也很高所以很多饭圈女孩也会聚集在这里。最近B站也开始涉足国产动画和国产游戏开发,以及试水自制真人秀。 2. B站过滤器的想法和制作过程”不从需求出发的数据分析都是做白功”,所以这一节从需求的确定,数据获取和设计可视化的想法来介绍一下过滤器的想法和制作过程。 2.1 需求:没有人觉得B站的视频搜索很难用吗?作为一个曾经的二次元,现饭圈女孩,博主本就算是B站常驻民。特别是今年夏天上头了一个叫博君一肖(王一博x肖战)的娱乐圈真人CP以后,已经在B站住了快小半年。每天的日常就是打开B站,搜索”博君一肖”这个关键词, 然后寻找视频来补充精神食粮。 然而,每天搜索同一个关键词,觉得寻找想要的视频越来越困难,主要体现在三点。 1)搜索结果内容比较杂乱搜索结果除了真人CP内容,还包含了人物角色CP(忘羡)内容,电视剧预告花絮等等。虽然能通过分区进行一定的过滤,比如有了经验以后我发现UP主的视频主要集中在”娱乐 - 明星”分区,和”影视 - 影视剪辑”分区,但是单从搜索结果来看,起初很难确定该选择哪个分区。 2)可以用来排序的选项比较单一在B站能通过 ”综合排序”,”最多点击”,”最新发布”,”最多弹幕”,”最多收藏” 来排序,但是一次只能选择其中一个,导致搜索结果常常不尽如人意。 【举例1】比如按照 ”最多点击” 来搜索热门视频的话,如下图结果,前几页的视频基本没有变化,永远是那几个经典的比较早期上传的视频。特别是CP大红初期的点击量特别高的视频简直是不可逾越的高墙。相信大家如果经常搜索某个tag的话也会有类似的体验。 【举例2】如果想找寻找新的视频,按照 ”最新发布” 来排序的话,那么前几页的视频几乎没有点击量,不知道该怎么衡量视频的质量,只能看封面和标题选视频碰碰运气。 虽然B站只显示50页结果,每页20个视频,也有1000个视频要翻,就算按照列表视图来看,也不太方便。 综合这些难用的地方,我在想如果有一个工具可以同时有这些功能就好了: 1) 直观的知道应该在哪个分区寻找视频 2) 帮助找到比较新又比较有人气的视频 3) 通过各种条件进一步过滤视频,不用翻50页 作为数据分析师,每天都要用Tableau来分析各种行业顾客的数据,帮助他们找到想要的信息从而做决策。于是我联想到既然它可以用来分析商业数据,为什么不能用来分析B站视频信息呢。 于是基于对精神食粮的渴望和对 ”博君一肖”真人CP上头的驱动力下,博主不眠不休(并没有),不吃不喝(别信)的花了一天做了一个非常简易的视频过滤器。 2.2 数据:获取相关视频信息巧妇难为无米之炊,要做过滤器第一步当然是想办法收集数据以及确认数据格式内容。 2.2.1 查找可以利用的B站API端口鲁迅曾经(并没有)说过, ”我们要站在巨人的肩膀上思考问题”。 这个世界上有很多优秀的工程师,他们致力于寻找和开发各种端口,并且大部分都很友好的总结了经验。所以在GitHub,知乎,各大论坛溜达了一圈,我很快就找到了一个不需要认证(API KEY)的B站前端API接口。在此特别感谢无私奉献的一位叫Georgebillion的朋友。 PS:虽然是前端接口,也请大家不要恶意调用,比如1秒发送100次请求之类的。留得青山在日后好相见,请大家不要恶意调用不要恶意调用不要恶意调用,重要的事情要说三次! 2.2.2 综合需求和成本设计数据表由于是前段接口,这个API可以调用的数据与B站网页是类似的,也就是说每一次搜索只能获取1000个视频。当然如果用其他API,也许可以实现获取所有相关视频的伟大愿望。但是第一,数据存放是需要花钱的,成本太高;第二,博主是个半吊子工程师,太复杂的码不会写;第三,博主的需求是寻找又有人气又新的视频,并不需要全部视频数据。 平衡了需求和成本之后,我决定每天只调用所有分区点击量最高的1000个相关视频信息作为原始数据。 2.3 可视化:结合数据和需求设计Tableau仪表盘从API获取的数据主要包含两类信息,一类是视频的说明信息 —— 包括ID,标题,描述,UP主,分区,上传日期等;另一类是视频的热度信息 —— 包括播放量,收藏量,评论数等。所以至少可以通过这两个维度来对视频进行过滤。 分类举例视频说明信息ID, 标题,描述,UP主,封面图URL,标签,时长,上传日期视频热度信息播放量,收藏量,评论数一般用户的阅读习惯是从左到右从上到下,所以仪表盘的设计也是遵从这个顺序。 综合数据和之前总结的需求,并且考虑了从简到繁的原则,我决定把Tableau的仪表盘分割成为三个部分。 第一部分通过各种条件初步过滤视频;第二部分为视频列表形式,通过视频标题和视频热度信息进一步深度过滤视频;第三部分提供了更加详细的个别视频信息,辅助最终决策(=是否观看视频)。 下面分别介绍各个部分分别满足了哪些过滤需求,以及通过各部分之间的互动如何达到更好的过滤效果。 这一部分包含四个过滤条件 —— 上传日期,视频分区,播放量分布,UP主词云图。 1)视频上传日期筛选(日期筛选器) 通过调整上传日期,可以很大程度过滤掉一部分早期的视频和看过的梗,当然想要重温的时候可以反过来选择比较早的日期。 这一部分是视频信息列表,包含了视频的标题信息,以及一些可以衡量视频人气的指标(播放量,收藏量,评论数等),并且对重要指标进行了一定程度的可视化。 第二部分的一种使用方法是显示第一部分的过滤结果。不过第二部分本身包含了这么多有用信息,所以通过添加两个筛选器(视频排名依据和关键词搜索),我尝试让它拥有更独立的功能。 1)视频排名依据(参数筛选器) 这个筛选器决定了视频列表的排序方式,包含了B站常用的播放数,收藏数和评论数;我还增加了发布时间,日均播放数。 按照”发布时间(最新)”排序的话,就可以查看最新跻身前1000的人气视频。当然,通过播放量排名和第一部分的日期过滤也可以实现差不多的功能。 2)关键词搜索(内容搜索的筛选器) 这个筛选器主要用于想要寻找特定内容的时候,可以实现对标题的再次筛选。 比如想要看包含博君一肖最著名的”九学”,”快本”(快乐大本营)的视频时就能用到这个功能。 通过第一部分的初步筛选和第二部分的功能,一般可以把视频结果缩小到一定的范围,这个时候视频标题也许就不足以做最终决定了。于是我增加了第三部分来展示视频详细信息。包括了在B站搜索页可以看到的封面图,和原来看不到的视频描述。 通过点击第二部分的视频标题,可以在这个部分分别查看该视频的信息。 视频过滤确实很重要,但是增加可执行的交互对于提高体验也是非常关键的。 这个过滤器的执行方式就是看选中的视频,如果好不容易找到一个视频,却需要复制它的标题再去B站搜索,那也太不方便了。幸好数据信息里包含了视频URL,通过增加一个转到URL的仪表盘操作,点击视频标题就可以很简单的通过浏览器跳转到视频的B站页面。 做好了视频过滤器之后,用了两天发现看视频的效率高了很多,于是决定与其他博君一肖的CP粉们分享。 Tableau有提供一个免费的软件版本Tableau Public,不仅能用来学习Tableau,也可以上传作品到Tableau Public网页与其他人共享。而且很贴心的是,它还提供了每天一次的数据更新选项(暂时只适用Google表格),足够满足我的更新需求。 因为免费所以Tableau Public对于数据库的种类有一定限制,并且不能规定共享对象,所以在实际的商务利用中一般用Tableau Online或者自己构建Tableau Server 下面是我的上传的Tableau Public链接,可以更直观的体验各种交互: https://public.tableau.com/profile/eris5000#!/vizhome/B_15697996268790/Bpublic Tableau可以用来做很多酷炫的可视化和数据分析,只要是可以帮助节省时间和改善决策过程的,都是数据改变生活的一步。这次的过滤器并没有用很复杂的可视化图表,也没有写什么惊天动地的代码,但是通过反馈知道节省了很多CP粉们的时间。 数据可视化还有很多接地气的用法,比如可视化自己的花销,寻找不必要的花费从而帮助储蓄;苹果用户们可以搜集健康app的数据可视化自己的运动量,步数和睡眠质量,从而督促自己早睡和运动。 博主还会尝试更多有趣的用法,也希望更多人会喜欢上数据可视化。 |
CopyRight 2018-2019 实验室设备网 版权所有 |