我把这个最好的test wiki全部翻译了一遍 💪

乙醇 创建于 19 days 之前

最后更新: 19 days 之前

阅读数: 160

全程自动化

之前给大家分享过这个测试wiki,https://ray.run/wiki

个人觉得还是非常全面好用的,不过因为是英文的,而且里面的内容不够直观,所以我直接翻译了一遍。最后的效果看这里,一共翻译了224个主题,好在是全程自动化,效率还是比较可观的。

具体做法

首先我写了个爬虫把所有的英文内容都爬了下来,这一步不难,毕竟熟练工,三下五除二就搞定了。然后就是调用openai或者是gemini的api做全文翻译,但是前者太贵,后者封我号,没办法,只能去打deepl的主意。

不过deeplx的翻译接口经常触发限频,没办法了只能另辟蹊径。

无奈之下只能在本地部署了个百川2 7b模型,调用百川2的api进行翻译,当然了,翻译时候尝试了很多策略,浪费了大量时间,最终才出来一个相对可用的版本。过程中发现了一些问题

  • 有时候显存不足导致翻译结果为空
  • 如果baichuan2翻译不了,那么它会直接返回原文,就会出现中英文混杂的情况

不过简单来说,翻译的结果凑合可用,而且我在wiki的详情页也给出了英文原文,也方便大家对照。

爬虫和翻译完成之后就是在itest上加个wiki模块,把爬下的内容导入到数据库之后,调整一下样式就可以上线了。

总的来说翻译很麻烦,毕竟openai和gemini的api都对我关上了大门,不过好在中文模型可以一战,这才做成了这个勉强可用的版本。

未来计划

  • 有精力的话完善一下翻译
  • 增加wiki搜索功能
1