「安倍晋三AI」東大生ら作成　ネットで賛否も…実弟・岸信夫氏がシェア、自民議員「素晴らしい」

家のダラダラ時間のお供に。自由自在の枕クッション「21ピロー」

第12世代CoreとRTX 3050 Ti搭載で1.43kgの14型ノート「GALLERIA RM7C-R35T」

イーロン・マスクが「もっとも個人資産を失った人」でギネス記録更新

コムドットやまと、イベントで石川県被災者へかけた一言に称賛の声! 「救われた人沢山いるはず」https://www.youtube.com/watch?v=4OWpOGVRWEI

「アイマスシャイニーカラーズ」5thライブで見た“心を強く揺さぶる挑戦的なステージ”

「感情揺さぶられっぱなし」千葉雄大の演技に反響　アバランチで見せた涙に「グッと来た」

【えっ】40年ぶりに復活した松屋の「チキン定食」がビックリするくらい普通！ …が逆に重要なことに気が付いた

サクッと軽いデニッシュ生地にバナナとマロンの香りが引き立つミスドの「ヨロイヅカ式デニッシュショコラドーナツ」2種を食べてみた

黄身と白身を入れ替える『反転ゆで卵』の作り方 / 殻を割って思わず笑顔になった

マイナンバーカードを健康保険証として使うと医療データ集計が容易になるというのは本当か？

君は楠公飯の味を知っているか～今週の検索ワード

指先でパソコンを操作できる！Bluetoothリングマウス

【ニュース・フラッシュ】パソコン工房、レースゲーム「Forza Horizon 5」推奨ゲーミングPC

南国の、ただかっこいいヤギたちよ

700TBのデータを20Gpbsワイヤレス光通信で5km離れた場所へ転送することにGoogle姉妹企業が成功

アップル、画像生成AI「MLLM-Guided Image Editing (MGIE)」を発表。でもだいぶやっつけ

旅先で珍しいと思ったものは地元にもある / うっかりデイリー 2022年5月14日号

rinna、36億パラメータの日本語特化GPT言語モデルを公開

PC Watch

2023.05.17

　rinna株式会社は、36億パラメータを持つ日本語特化のGPT言語モデルをオープンソースで公開した。特定のドメイン特化ではない汎用GPT言語モデルと、汎用GPT言語モデルを対話形式にファインチューニングした対話GPT言語モデルの2種類を用意。どちらもHugging Face上で商用利用可能なMIT Licenseにて公開している。

　汎用言語モデルは、日本語のWikipediaやC4、CC-100といったオープンソースデータ、対話言語モデルはHH-RLHF、SHP、FLANの一部を日本語翻訳したデータをそれぞれ用いて学習。汎用言語モデルでは、次の単語を予測するときの候補数を意味するperplexityで8.68を達成したという。

　用途に応じてモデルを選べるほか、ファインチューニングなどを通じて特定の利用目的に向けた性能の最適化も可能。対話言語モデルのインターフェイスには対話形式を採用し、利用しやすい設計とした。

　同社は、これまでにも13億パラメータの日本語特化GPTなどを公開してきたが、今回新たに2つの言語モデルを公開し、さらに利用の幅が広がることで、日本語言語モデルを活用した研究開発が発展するだろうと期待を寄せている。

関連

コメント

タイトルとURLをコピーしました