Yandex源代码泄露,情况如何?

关注者
750
被浏览
702,467

29 个回答

听说Yandex代码泄漏,作为代码囤积狂,自然第一时间去下载了一份。下载下来共44.7GB的源码,几乎包括了Yandex所有业务代码:

作为俄罗斯最大的互联网公司,Yandex有提供大量服务。最出名当然是Yandex Search了 [1]

作为Google的某种替代,Yandex Search在国内也有它的一些客户。它的排名算法和谷歌类似,都是PageRanking,也有AI排名算法和广告排位算法。研究它的算法,对网站的SEO优化Google网站排名应该有用:

我大概看了一下,网站基本的排名算法和部署脚本都包含了,甚至包含了一些安卓和iOS的APP程序,非常全。 缺憾是所有的markdown文档都是俄文的,完全看不懂!还有缺少训练好的模型和数据 ,看来是真的如报道所述,这个泄漏是git拖库下来打包的,二进制数据应该不存在Git仓库中(Git不适于存二级制大数据)。

接下来,我比较感兴趣的是 Alice AI助手(小爱同学?)、地图服务(百度地图?)、网盘服务(百度云盘?)、团购服务(美团?)、广告服务(百度排名?)、支付系统(支付宝?)、旅游(去哪儿?)、打车(滴滴?)、邮箱( 126.com ?)、云服务(阿里云?)、电商(淘宝?)、协同办公(金山云?)、数据分析、还有它的CI/CD系统 。我们从泄漏出来的压缩包名称中看到,这些服务都包含全了。这下好, 大半个中国互联网大佬替代方案都搬回家了 !可惜的都没有训练好的模型和二进制数据。

再说一句推上面说的PC问题,看起来俄罗斯的程序员种族歧视真不是盖得,用Nigger直接替换了通常说的master/slave中的slave:

大家都知道前一阵,欧美程序员掀起了一股PC风潮,在很多地方要替换掉以前经常用到的主从字眼(Master/Slave),个人感觉搞得有点过了。但俄罗斯直接反着来,让人刮目相看,吓得我赶紧搜了一下“chink”这个词,还好没有出现。比较令人困惑的是,Nigger这个字眼列在搜索引擎成人黑名单词汇中了,十分奇怪。

程序源码是计算机公司的核心资产,这次Yandex的代码泄漏给所有公司敲响警钟,代码仓库的权限管理要重视,个别程序员能够拖库整个公司所有代码仓库,这暴露了Yandex代码仓库管理权限管理的严重问题。

最后Yandex的代码应该够有心人好好研究一阵,对他们,我要说恭喜了!泄漏代码的文件清单在这里 [2] (仅有文件名清单)。

欢迎大家关注本专栏和用微信扫描下方二维码加入微信公众号"UEFIBlog",在那里有最新的文章。关注公众号,留言“ Yandex ”, 可得磁力下载链接

参考

  1. ^ Yandex Search https://yandex.com/
  2. ^ 文件清单 https://gist.github.com/ArseniyShestakov/53a80e3214601aa20d1075872a1ea989

magnet:?xt=urn:btih:7e0ac90b489baee8a823381792ec67d465488fef&dn=yandexarc&tr=udp%3A%2F%2Ftracker.openbittorrent.com%3A80%2Fannounce&tr=udp%3A%2F%2F9.rarbg.to%3A2920&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%2Fexodus.desync.com%3A6969&tr=udp%3A%2F%2Fbt1.archive.org%3A6969%2Fannounce&tr=udp%3A%2F%2Fbt2.archive.org%3A6969%2Fannounce&tr=udp%3A%2F%2Fopen.demonii.com%3A1337%2Fannounce