没有人觉得B站的搜索很难用吗? 您所在的位置:网站首页 ae8686视频分区 没有人觉得B站的搜索很难用吗?

没有人觉得B站的搜索很难用吗?

2023-09-05 20:22| 来源: 网络整理| 查看: 265

没有人觉得B站的搜索很难用吗?— 怎么用Tableau(数据可视化)帮助饭圈女孩磕CP 前言

提到数据可视化,大部分朋友可能会联想到公司决策,商业洞见等等很高大上的关键词,但其实数据可视化软件也可以用来做一些更接地气更有趣的事情。

最近我就试着用Tableau改善了一下自己的B站视频搜索体验,帮助饭圈女孩们更快乐的磕CP。 虽然是很剑走偏锋的用法,但是整个过程(确定需求 -> 获取/设计数据 -> 根据需求和执行方式设计可视化仪表盘)与商用的可视化是很类似的,希望对想要用Tableau做些什么的朋友们有一点的参考价值。

【我做的B站视频过滤器】 地址:https://public.tableau.com/profile/eris5000#!/vizhome/B_15697996268790/Bpublic

PS: 这个过滤器并没有用到很高大上的图表,如果朋友们有任何问题,评论,改善建议或意见,欢迎互动~ 在这里插入图片描述

1. Tableau和B站分别是什么?

不混二次元的朋友们也许对B站比较陌生,还有些朋友可能平常不怎么用到Tableau,这一节会非常简单的介绍一下B站和Tableau这个数据可视化工具。当然都比较了的朋友们请跳过这一部分。

1.1 什么是Tableau?

Tableau是一款BI(Business Intelligence)软件,通过数据可视化帮助决策。并且还扩展了辅助数据准备的Tableau Prep,以及实现云端共享的Tableau Online/Server等。

1.2 什么是B站?

B站是哔哩哔哩的昵称,是国内领先的年轻人文化社区和视频网站。一开始主要是二次元的集聚地,同时影视剪辑(影视二次创作同人作品)作品水平也很高所以很多饭圈女孩也会聚集在这里。最近B站也开始涉足国产动画和国产游戏开发,以及试水自制真人秀。

2. B站过滤器的想法和制作过程

”不从需求出发的数据分析都是做白功”,所以这一节从需求的确定,数据获取和设计可视化的想法来介绍一下过滤器的想法和制作过程。

2.1 需求:没有人觉得B站的视频搜索很难用吗?

作为一个曾经的二次元,现饭圈女孩,博主本就算是B站常驻民。特别是今年夏天上头了一个叫博君一肖(王一博x肖战)的娱乐圈真人CP以后,已经在B站住了快小半年。每天的日常就是打开B站,搜索”博君一肖”这个关键词, 然后寻找视频来补充精神食粮。 然而,每天搜索同一个关键词,觉得寻找想要的视频越来越困难,主要体现在三点。

1)搜索结果内容比较杂乱

搜索结果除了真人CP内容,还包含了人物角色CP(忘羡)内容,电视剧预告花絮等等。虽然能通过分区进行一定的过滤,比如有了经验以后我发现UP主的视频主要集中在”娱乐 - 明星”分区,和”影视 - 影视剪辑”分区,但是单从搜索结果来看,起初很难确定该选择哪个分区。

2)可以用来排序的选项比较单一

在B站能通过 ”综合排序”,”最多点击”,”最新发布”,”最多弹幕”,”最多收藏” 来排序,但是一次只能选择其中一个,导致搜索结果常常不尽如人意。 在这里插入图片描述

【举例1】比如按照 ”最多点击” 来搜索热门视频的话,如下图结果,前几页的视频基本没有变化,永远是那几个经典的比较早期上传的视频。特别是CP大红初期的点击量特别高的视频简直是不可逾越的高墙。相信大家如果经常搜索某个tag的话也会有类似的体验。 按点击排名永远都是早期视频在前几页

【举例2】如果想找寻找新的视频,按照 ”最新发布” 来排序的话,那么前几页的视频几乎没有点击量,不知道该怎么衡量视频的质量,只能看封面和标题选视频碰碰运气。 按最新发布排名

3)1000个结果全部翻完手表示它有点累

虽然B站只显示50页结果,每页20个视频,也有1000个视频要翻,就算按照列表视图来看,也不太方便。 50页结果

【总结需求】

综合这些难用的地方,我在想如果有一个工具可以同时有这些功能就好了: 1) 直观的知道应该在哪个分区寻找视频 2) 帮助找到比较新又比较有人气的视频 3) 通过各种条件进一步过滤视频,不用翻50页

作为数据分析师,每天都要用Tableau来分析各种行业顾客的数据,帮助他们找到想要的信息从而做决策。于是我联想到既然它可以用来分析商业数据,为什么不能用来分析B站视频信息呢。 于是基于对精神食粮的渴望和对 ”博君一肖”真人CP上头的驱动力下,博主不眠不休(并没有),不吃不喝(别信)的花了一天做了一个非常简易的视频过滤器。

2.2 数据:获取相关视频信息

巧妇难为无米之炊,要做过滤器第一步当然是想办法收集数据以及确认数据格式内容。

2.2.1 查找可以利用的B站API端口

鲁迅曾经(并没有)说过, ”我们要站在巨人的肩膀上思考问题”。 这个世界上有很多优秀的工程师,他们致力于寻找和开发各种端口,并且大部分都很友好的总结了经验。所以在GitHub,知乎,各大论坛溜达了一圈,我很快就找到了一个不需要认证(API KEY)的B站前端API接口。在此特别感谢无私奉献的一位叫Georgebillion的朋友。 PS:虽然是前端接口,也请大家不要恶意调用,比如1秒发送100次请求之类的。留得青山在日后好相见,请大家不要恶意调用不要恶意调用不要恶意调用,重要的事情要说三次!

2.2.2 综合需求和成本设计数据表

由于是前段接口,这个API可以调用的数据与B站网页是类似的,也就是说每一次搜索只能获取1000个视频。当然如果用其他API,也许可以实现获取所有相关视频的伟大愿望。但是第一,数据存放是需要花钱的,成本太高;第二,博主是个半吊子工程师,太复杂的码不会写;第三,博主的需求是寻找又有人气又新的视频,并不需要全部视频数据。 平衡了需求和成本之后,我决定每天只调用所有分区点击量最高的1000个相关视频信息作为原始数据。

2.3 可视化:结合数据和需求设计Tableau仪表盘

从API获取的数据主要包含两类信息,一类是视频的说明信息 —— 包括ID,标题,描述,UP主,分区,上传日期等;另一类是视频的热度信息 —— 包括播放量,收藏量,评论数等。所以至少可以通过这两个维度来对视频进行过滤。

分类举例视频说明信息ID, 标题,描述,UP主,封面图URL,标签,时长,上传日期视频热度信息播放量,收藏量,评论数

一般用户的阅读习惯是从左到右从上到下,所以仪表盘的设计也是遵从这个顺序。 综合数据和之前总结的需求,并且考虑了从简到繁的原则,我决定把Tableau的仪表盘分割成为三个部分。

第一部分通过各种条件初步过滤视频;第二部分为视频列表形式,通过视频标题和视频热度信息进一步深度过滤视频;第三部分提供了更加详细的个别视频信息,辅助最终决策(=是否观看视频)。

下面分别介绍各个部分分别满足了哪些过滤需求,以及通过各部分之间的互动如何达到更好的过滤效果。 仪表盘的整体模块设计

第一部分:初步过滤视频

这一部分包含四个过滤条件 —— 上传日期,视频分区,播放量分布,UP主词云图。

1)视频上传日期筛选(日期筛选器) 通过调整上传日期,可以很大程度过滤掉一部分早期的视频和看过的梗,当然想要重温的时候可以反过来选择比较早的日期。 上传日期筛选 2)视频分区分布(工作表) 这个过滤器是前1000个人气视频所在的分区分布热图。可以一目了然的知道大部分视频集中在哪个分区,通过点击一个或按住CTRL键同时选取几个分区,更好的框定想要的视频范围。 比如可以想象明星分区包含的是真人内容为主,而影视剪辑分区有可能包含肖战和王一博的电视剧角色拉郎视频。 视频分区分布 3)视频播放数分布(工作表) 播放量一定程度上代表了视频的人气,所以通过播放量的分布可以实现按照人气指数量的各个阶梯来查看包含的视频。 *因为博君一肖是个特别热门的TAG所以这里按照十万百万单位来做阶梯 视频播放量分布 4)UP主词云图(工作表) 这里展示了前1000个视频中,每个UP主所占的视频个数(=文字大小)和播放量综合(=颜色深浅)。可以点击产出数量较多的UP主,或者总播放量很高的UP主,在第二部分直接查看该UP主的视频列表。 UP主词云图 5)以上4个条件可以互相联动 以上任何一个条件都可以帮助过滤一部分视频。不过Tableau的仪表盘的特色之一可以通过添加筛选器,实现所有条件(工作表)的互相联动,从而达到更深度的过滤。 比如下图点击两次,抽取了影视剪辑分区,点击量在100万级的6个视频,所以在第二部分的视频列表只显示这6个视频。当然如果是20万点击量级的视频,还可以再通过UP主等等来进一步筛选。 在这里插入图片描述

第二部分:视频列表深度过滤

这一部分是视频信息列表,包含了视频的标题信息,以及一些可以衡量视频人气的指标(播放量,收藏量,评论数等),并且对重要指标进行了一定程度的可视化。

第二部分的一种使用方法是显示第一部分的过滤结果。不过第二部分本身包含了这么多有用信息,所以通过添加两个筛选器(视频排名依据和关键词搜索),我尝试让它拥有更独立的功能。

1)视频排名依据(参数筛选器) 这个筛选器决定了视频列表的排序方式,包含了B站常用的播放数,收藏数和评论数;我还增加了发布时间,日均播放数。 按照”发布时间(最新)”排序的话,就可以查看最新跻身前1000的人气视频。当然,通过播放量排名和第一部分的日期过滤也可以实现差不多的功能。 视频排名依据

2)关键词搜索(内容搜索的筛选器) 这个筛选器主要用于想要寻找特定内容的时候,可以实现对标题的再次筛选。 比如想要看包含博君一肖最著名的”九学”,”快本”(快乐大本营)的视频时就能用到这个功能。 关键词搜索 当然,这个两个筛选器也都与下面的搜索结果列表联动,所以可以互相配合使用。例如找到最新/播放量最高的”九学”,”快本”相关视频。

第三部分:视频详细信息

通过第一部分的初步筛选和第二部分的功能,一般可以把视频结果缩小到一定的范围,这个时候视频标题也许就不足以做最终决定了。于是我增加了第三部分来展示视频详细信息。包括了在B站搜索页可以看到的封面图,和原来看不到的视频描述。 通过点击第二部分的视频标题,可以在这个部分分别查看该视频的信息。 视频详细信息

2.4 根据用户执行方式增加交互

视频过滤确实很重要,但是增加可执行的交互对于提高体验也是非常关键的。 这个过滤器的执行方式就是看选中的视频,如果好不容易找到一个视频,却需要复制它的标题再去B站搜索,那也太不方便了。幸好数据信息里包含了视频URL,通过增加一个转到URL的仪表盘操作,点击视频标题就可以很简单的通过浏览器跳转到视频的B站页面。 执行可能的交互

2.5 用Tableau Public实现共享

做好了视频过滤器之后,用了两天发现看视频的效率高了很多,于是决定与其他博君一肖的CP粉们分享。 Tableau有提供一个免费的软件版本Tableau Public,不仅能用来学习Tableau,也可以上传作品到Tableau Public网页与其他人共享。而且很贴心的是,它还提供了每天一次的数据更新选项(暂时只适用Google表格),足够满足我的更新需求。 因为免费所以Tableau Public对于数据库的种类有一定限制,并且不能规定共享对象,所以在实际的商务利用中一般用Tableau Online或者自己构建Tableau Server

下面是我的上传的Tableau Public链接,可以更直观的体验各种交互: https://public.tableau.com/profile/eris5000#!/vizhome/B_15697996268790/Bpublic Tableau Public 我有开放下载权限,虽然没有使用很酷炫的图标,但是如果对仪表盘的制作方法有兴趣的朋友可以点击下载Tableau工作簿来查看具体用了哪些功能。

3. 总结

Tableau可以用来做很多酷炫的可视化和数据分析,只要是可以帮助节省时间和改善决策过程的,都是数据改变生活的一步。这次的过滤器并没有用很复杂的可视化图表,也没有写什么惊天动地的代码,但是通过反馈知道节省了很多CP粉们的时间。 数据可视化还有很多接地气的用法,比如可视化自己的花销,寻找不必要的花费从而帮助储蓄;苹果用户们可以搜集健康app的数据可视化自己的运动量,步数和睡眠质量,从而督促自己早睡和运动。 博主还会尝试更多有趣的用法,也希望更多人会喜欢上数据可视化。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有