PLaMo: 高度な対話型生成AI
PLaMo(プラモ)は、Preferred Elements社によって開発された対話型生成AIで、大規模な言語モデルを基にしています。このプロジェクトは、2024年8月7日にβ版のトライアルが開始され、今後の情報通信時代を見据えた最先端の技術の一つとして注目を集めています。PLaMoは、自然言語処理だけでなく、マルチモーダル学習機能を具備しており、多様なデータタイプを統合的に扱えることが特長です。具体的には、センサー値や分子構造といった情報も含まれ、その応用範囲は広がる一方です。
背景と開発の目的
このプロジェクトは、日本の「ポスト5G情報通信システム基盤強化研究開発事業」(NEDOの助成事業)に関連しており、生成AIの基盤モデルを向上させることを目的とした「GENIAC」プロジェクトにおいて、PLaMo-100Bモデルが採用されています。今後、商用モデルである「PLaMo Prime」が2024年12月に発売される予定で、非常に期待されています。
モデルの詳細
PLaMoにはいくつかのモデルが存在します。まず、
PLaMo-13Bは、130億パラメータを持つ事前学習済みの
大規模言語モデル(LLM)です。一方で、
PLaMo-100Bは、1000億パラメータからなるマルチモーダル基盤モデルとして、PLaMo β版トライアルのベースとして使用されています。
さらに、商用向けのフラッグシップモデル「PLaMo Prime」も発表され、2024年12月にはサービスが開始される計画です。このモデルは、日本語に特化した性能が強化されており、文章生成や要約、翻訳、テキスト分析などの自然言語処理タスクへの対応力が向上しています。また、これまでの4倍となる約16,000トークンのコンテキスト長を持ち、RAG(検索拡張生成)技術の精度も高まっています。PLaMoはWeb APIを通じて外部アプリケーションから利用できる「PLaMo API」や、対話型AIアシスタント「PLaMo Chat」を提供しており、後者は期間限定で無料トライアルが実施されることもあります。
PLaMo 2.0 Primeの登場
2025年5月22日には「PLaMo 2.0 Prime」がリリースされ、最新のフラッグシップモデルとしての位置づけがなされました。このモデルは、GENIACプロジェクトの成果を基に開発されており、日本語の生成性能や指示への応答能力が大きく向上しています。特に、パラメータ数は8Bおよび31Bの二つの系列が存在し、小型モデル(8B)はPLaMo 100Bと同等かそれを上回る日本語やコード生成の性能を実現しています。大型モデル(31B)は、同クラスの他社モデルを凌ぐ性能を発揮し、日本語生成能力を評価するpfgenベンチマークではGPT-4oに次ぐスコアを記録しています。
技術革新と効率性
PLaMo 2.0では、高品質な独自のデータセットの活用や新たなトークナイザによるトークン処理の効率化、Self-attentionの代わりに一部層にMambaを導入することによりKVキャッシュの削減が行われています。これにより、生成速度は約2倍(35文字/秒から76文字/秒)に向上し、利用コストも大幅に低減しました。APIの価格も従来の1/4以下に設定されており、入力60円、出力250円というリーズナブルな料金で提供されています。
まとめ
PLaMoは対話型生成AIにおいて、日々進化を遂げており、今後の発展が大いに期待されるテクノロジーです。多様なデータを扱える能力と日本語の向上が見込まれるPLaMoは、さまざまな分野での応用が期待されています。
外部リンク: PLaMo