1978年
9月26日、日本の情報処理史に新たな章が刻まれました。この日、東京芝浦電気(現・
東芝)は、世界で初めて日本語の文書作成を可能にした画期的な機器「JW-10」を発表したのです。翌年2月に出荷が始まったこの日本語
ワードプロセッサは、その後の日本の情報化社会を大きく変える礎となりました。発表日は後に日本記念日協会により「ワープロの日」と制定されています。
現在のパソコンとは大きく異なり、JW-10は価格630万円、重さ220kgという、片袖机ほどの巨大な筐体を持っていました。その中に、日本語を入力するためのキーボード、表示用の
ブラウン管ディスプレイ、そして10MBのハードディスク、8インチの
フロッピーディスクドライブ、さらに印刷を行うための
プリンターといった一連の装置が収められていました。開発当初は高額で普及を疑問視する声もありましたが、その開発過程で培われた「かな
漢字変換」の技術は、現代の
日本語入力システムの根幹をなすものとなり、日本の情報処理技術を世界に示す先駆けとなりました。この技術は、東南アジア諸言語の
ワードプロセッサ開発にも応用されるなど、国際的な影響も与えています。
JW-10の開発は、
1970年代初頭に
東芝の森健一氏が通商産業省の機械翻訳プロジェクトに関わっていたことに端を発します。コンピュータで日本語を英語に翻訳するには、まず日本語の文法解析が必要でした。多くの例文を集めるために新聞社などを訪れた森氏は、そこで自動翻訳よりも、日本語の文書を効率的に作成する装置への強いニーズがあることに気づきます。ある時、新聞記者との雑談で、欧米の記者に比べて日本の記者は記事作成が遅いという話題になり、これが森氏に日本語
ワードプロセッサ開発を決意させる直接的なきっかけとなりました。紙媒体より速く、遠隔地への伝送が可能で、将来的には携帯もできるような、新しい文書作成ツールの構想が生まれたのです。
日本語
ワードプロセッサ開発における最大の難関は、膨大な数の
漢字をどう入力するかという問題でした。既に1915年には杉本京太氏が邦文
タイプライターを開発していましたが、これは多くの
漢字から目的のものを探し出す方式で、習熟に時間がかかり、手書き以上の速度は望めませんでした。
漢字の
偏と読みで候補を絞る「音訓方式」も検討されましたが、これも入力速度に課題がありました。
1970年代には
東芝以外にも多くの企業が日本語ワープロを研究しており、当時は「連想式」、すなわちかな2文字で
漢字を直接入力する方法が主流でした。しかし、この方式では対応できる
漢字数に限界があり、個々の
漢字の入力方法を覚える負担が大きいという欠点がありました。森氏は、誰もが簡単に使えることを目指し、あえて主流ではなかった「かな
漢字変換」方式の採用を決断します。
かな
漢字変換の研究は当時、ごく一部の学者が手がけている程度で、参考資料もほとんどありませんでした。森氏は、この難題に取り組むため、
九州大学出身の新入社員、河田勉氏を
京都大学の
長尾真助教授のもとへ国内留学させ、
形態素解析(文を言葉の最小単位に分解する技術)の研究を進めさせました。森氏自身も、かな変換に必要な辞書を構築するために日本語の文法を徹底的に学び、計量国語学会にも入会しました。さらに、
京都大学で文字認識を研究していた大学院生の天野真家氏も河田氏の誘いでチームに加わります。こうして研究メンバーが増えましたが、当初は非公式な「アンダー・ザ・テーブル」と呼ばれる形で研究は進められました。森氏が全体を統括し、河田氏が
形態素解析プログラム、天野氏が意味・文法解析アルゴリズムを開発しました。その後、プログラマーの武田公人氏も加わり、特に
固有名詞の処理を担当するなど、開発体制が強化されていきました。
かな
漢字変換に不可欠な辞書の構築も困難を極めました。森氏は、国語辞典だけでなく、高校教科書、和英辞典、事務文書規範、用語用例集、
同音異義語辞典など、多様な資料から頻繁に使われる単語を抽出しました。人名については、知り合いの保険会社に協力を仰ぎ、契約者データから主要な姓・名を収集するという徹底ぶりでした。最終的に約8万語を選定し、専門のオペレーターが
パンチカードを使って、それぞれの読みや文法情報をコンピュータに入力するという手作業が行われました。
漢字フォントの製作も専門のデザイナーに依頼しましたが、1週間で作成できるのは100字程度というペースで、辞書とフォントの開発だけで3年以上を要しました。また、プリンタに必要な高性能な印字ピンも
東芝にはなく、
東芝タンガロイに特別に製作を依頼するなど、外部の協力も不可欠でした。
1976年3月、かな
漢字変換プログラムと単語辞書がある程度形になった段階で、チームは大型コンピュータを使って変換精度や必要な校正機能をシミュレーションする実験を行いました。これは、キーボード入力を
紙テープに出力し、計算機室で処理後、結果を
磁気テープで持ち帰って印刷するという、時間のかかる
バッチ処理でした。翌月、かな
漢字変換の有効性に確証を得たチームは「日本語処理の研究」として正式に企画書を提出。研究所の正式な研究テーマとなり、チームは10人に増員され本格的な開発が始まります。
バッチ処理の非効率性を解消するため、
ミニコンピュータを使った試作機が開発され、1977年3月に完成。これにより、入力、表示、印刷が一つのシステム内で完結できるようになりました。そして1977年11月からは、全社を挙げてJW-10の商用化に向けた開発がスタート。コンピュータ事業部が回路設計と製造を担当し、情報システム研究所がOSや主要ソフトウェアを開発、オフィスコンピュータ部門がディスプレイ・プリンタ、半導体事業部が
CPUや
漢字ROMを担当するなど、
東芝の総合力が結集されました。
JW-10のかな
漢字変換は、現代のシステムにも通じる2層構造を採用していました。基本的には、
学校文法に基づき、文を「自立語+付属語」のまとまりである「
文節」の連続として捉えます。しかし、現実の文章には
固有名詞や複雑な複合語が多く登場するため、下の層で単語同士を結びつける複合語合成の処理も行いました。さらに変換精度を高めるため、「局所意味処理」という独自の手法も開発・実装されています。
漢字変換における最大の課題は、同じ読みで意味が異なる「
同音異義語」の選択でした。JW-10は、単語の前後関係や、その単語が使われる頻度(全体の頻度と直前に使用された
漢字との組み合わせ頻度)を考慮して変換候補を絞り込む工夫を凝らしました。森氏は後に、この
同音異義語処理の発想こそが、日本語ワープロの実用化に不可欠だったと振り返っています。辞書は当時としては大容量の10MBハードディスクに収められ、約8万語の登録が可能で、使用頻度も利用者ごとに管理できました。現在の多くのワープロやパソコンが文章を自動的に
文節に区切るのに対し、JW-10ではユーザーが手動で
文節を指定する必要がありました。「
文節指定入力」と「
漢字指定入力」の二つのモードがあり、さらに
文節ごと、あるいは文章全体を一括して変換する方式も選択できました。機械が候補を確定できない場合は、画面上で該当箇所が点滅し、ユーザーが手動で正しい候補を選びました。
JW-10には、文書の校正や編集を行うための「
エディタ」機能が搭載されていました。当時のコンピュータでは、文書を1行ずつ編集する「ライン
エディタ」が一般的でしたが、JW-10はディスプレイ上で文書全体を見ながら編集できる「スクリーン
エディタ」を実装しました。天野真家氏を中心に開発されたこの
エディタは、「統一された原理で操作できること」「思考を中断させないこと」という二つの設計思想に基づいていました。操作の統一性は「位置・範囲の指定」→「校正操作」という順序で実現され、思考の中断を防ぐために同音語の候補決定はユーザーが任意のタイミングで行えるようになっていました。入力中に候補が複数あっても、画面上では最初の候補が点滅表示されるだけで、全候補は内部に保持され、ユーザーは打ち続けることが可能でした。しかし、当時のコンピュータのメモリ制限から、多くの候補を保持すると
仮想記憶のスワップのような現象が起き、処理速度が遅くなるという技術的な制約があり、「思考を中断させない」という理想は完全には達成されませんでした。
JW-10のハードウェアは、実用性を重視した設計でした。一般的なビジネスパソコンが16×16ドットのフォントを使用する中で、JW-10はディスプレイと
プリンターに24×24ドットの高精細なフォントを採用しました。これは、字画の多い
漢字を正確に表示するためであり、契約書や申請書のような公文書作成に適していると考えられたからです。
プリンターには、公文書の保存性や耐改ざん性、さらには商取引で使われる複写用紙への印刷を考慮し、ドットインパクト方式が選ばれました。ディスプレイは長時間作業でも見やすいよう配慮されていましたが、当時の高解像度ディスプレイが高価だったため、コストとのバランスから表示能力は横32字×縦14行に制限されていました。この表示能力の限界は、1980年に発売された後継機のJW-10モデル2で改善されています。
JW-10とその開発チームの功績は高く評価されています。
情報処理学会は、JW-10に搭載された優れた日本語入力方式を普及させた功績に対し、平成14年度の業績賞を天野真家氏、森健一氏、河田勉氏らに贈りました。また、国際的な電気・電子技術者組織である
IEEEは、JW-10を「日本語のための最初の
ワードプロセッサ」として
IEEEマイルストーンに認定し、その歴史的な意義を讃えています。JW-10は、高価で巨大な初期モデルでしたが、その開発で培われた革新的な技術は、その後の日本語情報処理、ひいては日本の情報化社会全体の発展に不可欠な礎を築いたのです。