我把这个最好的test wiki全部翻译了一遍 💪
乙醇 创建于 9 months 之前
最后更新: 9 months 之前
阅读数: 1125
之前给大家分享过这个测试wiki,https://ray.run/wiki
个人觉得还是非常全面好用的,不过因为是英文的,而且里面的内容不够直观,所以我直接翻译了一遍。最后的效果看这里,一共翻译了224个主题,好在是全程自动化,效率还是比较可观的。
具体做法
首先我写了个爬虫把所有的英文内容都爬了下来,这一步不难,毕竟熟练工,三下五除二就搞定了。然后就是调用openai或者是gemini的api做全文翻译,但是前者太贵,后者封我号,没办法,只能去打deepl的主意。
不过deeplx的翻译接口经常触发限频,没办法了只能另辟蹊径。
无奈之下只能在本地部署了个百川2 7b模型,调用百川2的api进行翻译,当然了,翻译时候尝试了很多策略,浪费了大量时间,最终才出来一个相对可用的版本。过程中发现了一些问题
- 有时候显存不足导致翻译结果为空
- 如果baichuan2翻译不了,那么它会直接返回原文,就会出现中英文混杂的情况
不过简单来说,翻译的结果凑合可用,而且我在wiki的详情页也给出了英文原文,也方便大家对照。
爬虫和翻译完成之后就是在itest上加个wiki模块,把爬下的内容导入到数据库之后,调整一下样式就可以上线了。
总的来说翻译很麻烦,毕竟openai和gemini的api都对我关上了大门,不过好在中文模型可以一战,这才做成了这个勉强可用的版本。
未来计划
- 有精力的话完善一下翻译
- 增加wiki搜索功能