添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
Zenn
🎋

大規模言語モデル(LLM)の作り方 GPT-NeoX編 Part 1

Kazuki Fujii 2023/07/19 に公開 1

Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 の藤井( @okoge_kaz )です。

大規模モデルへの注目の高さを肌で感じる今日このごろですが、事前学習の知見については依然として十分に共有されているとは言い難いと個人的に感じています。

Turing株式会社では、次世代の自動運転技術を支える技術の1つとして大規模言語モデルに注目しており、独自に研究開発を行っています。今回は大規模言語モデルを学習する際、用いるライブラリ候補の1つに上がるであろうGPT-NeoXについて解説します。

以下で環境構築方法、学習を行う方法などについて詳しく解説します。