【个人整理+分析】已汉化的Galgame大全 您所在的位置:网站首页 3d2銭f6镝fb鏓df730740 【个人整理+分析】已汉化的Galgame大全

【个人整理+分析】已汉化的Galgame大全

2023-08-15 12:54| 来源: 网络整理| 查看: 265

之前在巴哈姆特上看到了一位大神(ID:祈雨),这哥们独自一人整理了一份已汉化的GALGAME集+汉化组,总共约1500部,遂大惊。(os:以后终于不用去弟弟官网上找资源了)

原地址:

之后爬取了他整理的原数据集的表格,可惜格式比较乱,(因为所有的文字都是他手工打出来的),而且导出后的日文标题中有些符号也有问题。

所以我就对他原表格里的数据进行了一些清洗,同时将他整理的数据与VNDB数据库的评分做了一个连接,拼出了一个还算整齐的csv表(连接大概是95%的准确率)。

有兴趣的同学可以直接导入这个csv文件做自己喜欢的统计。

当然我也会在本文中做一些简单的统计展示。

效果巴哈姆特上的整理(视觉效果比较好)result(utf-8).csv(导入pandas效果)result(gbk).csv(excel打开效果)下载地址(200KB)

链接: https://pan.baidu.com/s/1TYfyCEfBAsQnVILa3rJGBg 提取码: dpax

zip中包含三个文件:

result(gbk).csv(这个是可以直接用excel打开的版本)result(utf-8).csv(这个是可以直接python导入的版本)dataset(original).csv(这个是原数据)喜闻乐见的统计环节

1.汉化游戏总数:1494

2.评分人数分布

评分人数 游戏数量 0~100 802 100~200 225 200~300 80 300~400 58 400~500 18 500~600 20 600~700 21 700~800 12 800~900 15 900~1000 14 1000+ 114

点评:

从表中我们可以看出,即使游戏被汉化了,绝大多数游戏依然陷入了“无人问津”的尴尬境地。(有同学指出因为连的是vndb的数据,因此展示“汉化游戏”的评分人数数据是不准确的。我之后会尝试用bangumi的数据,感谢指正。)

如果我们把300票作为分界线,有约81%的galgame都属于冷门类gal(评分人数前10名依次为:1.Fate/stay night2.沙耶の唄3.G線上の魔王4.STEINS;GATE(命运石之门)5.CLANNAD-クラナド-6.Doki Doki Literature Club!7.マブラヴ(Muv-Luv)8.マブラヴ オルタネイティヴ(Muv-Luv Alternative)9.Ever17 -the out of infinity-10.リトルバスターズ!(Little Buster)

点评:

Fate系列拿了VNDB人气榜的第一,评分人数超过1w,之后9部作品相信大家都不陌生。

不得不说,这个榜让我感觉很意外,有一些我心目中不错的作品人气甚至没有排到前30,或许是因为欧美玩家和亚洲玩家对作品的喜好不同吧。

4.最勤勉的10个汉化组(这个统计可能会漏掉一部分作品)

汉化组名 汉化作品数 个人汉化 105 心愿屋汉化组 92 默示汉化组 42 脸肿汉化组 39 默示游戏中文化兴趣小组 28 未来数位 28 萌你妹汉化组 25 AUGUST中文化委员会 19 CK-GAL中文化小组 16 哈尼喵汉化组 16

点评:不了解汉化这一块,不敢对汉化组的翻译质量多做评价。但对于绝大多数玩家来说,有汉化,才有接触某部gal的机会,否则即使再好的作品,也会因为语言障碍而无从下手。因此无论是哪部作品,我都会在游戏结束后默默感谢汉化组的无私付出。

5.人气最高的会社

制作公司(母) 总投票数 Key 42730 Nitro+(ニトロプラス) 33390 TYPE-MOON 24279 07th-Expansion 19318 AKABEiSOFT2 16394 ?ge(アージュ) 12240 ALICESOFT 11600 NEKO WORKs 11126 Frontwing(フロントウイング) 10988 KID 9206 Leaf / AQUAPLUS 9104 YUZU-SOFT(ゆずソフト) 9058 CIRCUS(サーカス) 8756 Innocent Grey 8587 ふぐり屋 / ゆりんゆりん 8389

点评:这里的总投票数只是简单求和,会受到游戏发行数量的影响,仅供参考。

其它的统计就不做了,大家有兴趣可以自己玩。

注意事项评分及人数数据来自VNDB,有人可能会问:为什么不用批评空间的数据?——因为批评空间的数据不好拿。连接原数据与VNDB数据采用的是近似匹配算法,所以不能够保证所有游戏的名称和数据百分之百对应,如果有错误,还望见谅,请自行手工修正。部分游戏译名为暂无译名,有三个原因:1.游戏本身没有正式的中文译名 2.游戏原名太奔放、不宜展示 3.原作者懒得查游戏的评分为0,有2个原因:1.评分人数过少 2. 属于争议条目(见文末)本文数据均来自开放平台,遵循VNDB的数据开放协议,同时也感谢原数据作者祈雨。如果打开遇到乱码的情况,请参考这篇文章https://www.cnblogs.com/yoyotl/p/12988356.html原数据集

地址(需科学上网):https://home.gamer.com.tw/creationDetail.php?sn=1972708

会社与会社的游戏信息之间有空行分隔|删除空行后reset_index游戏译名、汉化组、汉化进度文字均为繁体|(库langconv做繁中翻译)部分游戏名称前后有多余空格|(strip)游戏译名存在为空的情况、汉化组存在为空的情况|(fill)游戏名称中有部分解码失败(比如·,☆等符号)| (与VNDB数据库做字符串相似度匹配,用VNDB的Original Title替换游戏名称)*原数据集encoding为gbkVNDB数据集

VNDB-API地址:https://vndb.org/d11(数据库文件名为vn和vn.headers)

VNDB encoding为utf-8而原数据集encoding为gbk|encoding规则统一修改为utf-8字符串相似度匹配用jaro算法(jaro_winkler有明显误判情况)VNDB数据标号id列非连续(大坑)|被迫删掉id列再reset_indexoriginal列有空名|(直接用空字符串fill)原数据集与VNDB数据集字符串有失配的情况,比如その横顔を見つめてしまう无法在VNDB中匹配| 设置similarity参数,如果最大匹配度低于similarity(我这里设置为0.8),失配! #例:典型错误 Levenshtein.jaro_winkler('その横顔を見つめてしまう','夕櫻を見つめて') 0.7103174603174603英文标题的游戏统一转成小写匹配,否则可能失配,比如八月社的FORTUNE ARTERIAL可能会无法匹配fortune arterialc_popularity、c_ratingcount、c_votecount一栏会出现'\N'|替换为0(官方数据缺失标记,所以空值既有可能是Nan,也有可能是\N,小坑)关于原数据集中标题的修正记录(共40部)

由于平/片假名、半角/全角字体等差异、或者是原作者将原作的alias和原标题进行了花式混合,因此程序未能检测出,只能手工修正。

一切修正以VNDB中的Original Title为准。

因为知乎不允许插表格,所以只能发图片了。

有争议的条目CoronaBlossom vol.1 Gift From the Galaxy/CoronaBlossom vol.2 The Truth From Beyond/CoronaBlossom vol.3 Journey to the Stars |三部作品均属同一系列,VNDB仅展示一个条目 无评分 下同ボクの彼女はガテン系(译名:民工女友)|这部作品有4个原名,分别是:ボクの彼女はガテン系/彼女がした事、僕がされた事/巨乳妻完全捕獲計画/ボクの妻がアイツに寝取られました てんたま1st ~ Sunny side|为てんたま的Release版之一 无评分想いのかけら -Close to-|为Close to ~祈りの丘~的PSP版本 无评分ときめきメモリアル ~forever with you~|为 ときめきメモリアル的Release版本 无评分雫-しずく|这部作品有2个原名:雫 -しずく-/Drip ef - the first tale.`和`ef - the latter tale.|是ef - a fairy tale of the two.的两部Release版 无评分すぴぱら NICE TO MEET YOU!和すぴぱら STORY #01 - Spring Has Come!|是すぴぱら的两部Release版 无评分Miel的几部作品出现0分的情况是因为标题过长且过于暴露,不列入本文考虑范围内Phantom~integration~|是Phantom of Inferno的Release版之一 无评分Go! Go! Nippon! 2015|是Go! Go! Nippon! ~My First Trip to Japan~的Release版 无评分かたわ少女|かたわ少女 有v2~v5 4个Release版本 无评分(这部作品的人气很高)

完。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有