※本ページ内の情報は2024年3月時点のものです。

ChatGPTや生成AIという言葉が世間をにぎわせている。現在は2010年代前半から始まった第3次AIブームの更なるAIブームの勃興ともいえる。IDCの示したデータによると、国内AI市場の成長予測は2022年から2027年においてCAGR(年平均成長率)23.2%となっている。

今から26年前、音声認識市場が皆無とも言えた日本において音声認識市場化の事業に着手し、常に時代の先頭に立つ株式会社アドバンスト・メディア。

今回は、代表取締役社長である鈴木清幸氏から、音声認識事業に着手するきっかけや、今後の展望について話を聞いた。

米国での運命的な出会い

ーー貴社のビジネスが始まったきっかけを教えてください。

鈴木清幸:
私は約40年前に第2次AIブームに乗り創業された株式会社インテリジェントテクノロジーに入社後、提携関係にあったカーネギーメロン大学(CMU)のスピンオフカンパニー・カーネギーグループ社に派遣され、第2次AIを学び日本へ普及させる活動に勤しんでいました。そのような中で、AIの一分野であった音声認識の研究において当時の中心メンバーらとCMUのAI研究の中核機関であったロボティックス研究所で出会い、私の描いた夢に彼らが乗ってきてくれたことをきっかけに、彼らとともに日本と米国における音声認識の同時市場開拓を目的とした事業を始めました。

CMUで出会った彼らは、DARPA(注1参照)が主催する音声認識の競技会で2年連続優勝という華々しい実績を有していました。

一方、当時の私はAIの普及に勤しみながらも、キーボードでAIへの指示を入力する方法では普及が難しいのではないかとも考えていました。

そのような中で、彼らとの出会いにより音声認識を用いることでのAIの普及に大きな可能性を見出したのです。まずは、音声認識の市場開拓を成功させ、そして、AIの普及へと繋げることを考えました。

1997年11月に彼らに米国でISIという会社を設立させ、1997年12月に私が日本で弊社を設立しました。ここに、日米協働で音声認識の市場化の事業開発という前代未聞のプロジェクトが始まったのでした。

注1) DARPA(Defense Advanced Research Projects Agency):アメリカ合衆国の国防総省に所属し、高度な研究プロジェクトを推進するために設立された独立機関。

戦略的な投資がもたらした成長

ーー困難な状況があったと思いますが、どのように乗り越えられましたか?

鈴木清幸:
彼らが設立したISIが、2000年にベルギーで興り米国で大きく成長した音声認識の会社に買収されてしまいました。ISIは弊社が目指す音声認識の市場化にとって極めて重要な会社ですから、まさに危機でした。

そこで、2001年に弊社が資金提供し、筆頭株主の新会社MTL(Multimodal Technologies, LLC.)を米国に設立し、MBO(経営陣による買収のこと)によりISIを買い戻しました。この結果、ISIはなくなりましたが、ISIを買取ることで、逆に弊社の事業成長の可能性がより高まったのでした。

その後、MTLの時価総額を10年間で40倍に増大させることができました。2011年にMTLの株式を売却し、その資金の一部を使い、現在の弊社の業績が右肩上がりとなる成長構造の土台づくりに成功しました。

領域特化でシェアNo.1!

ーー貴社の「AmiVoice®」について教えてください。

鈴木清幸:
発話に対して、音響モデルの分析結果に基づき認識デコーダが大規模言語モデル(LLM)によりテキストに変換する技術が音声認識です。弊社はエンロールメントという利用者による事前の学習を要せずに利用者の自然発話に対応できるという他社が真似られないAI音声認識「AmiVoice®」を開発し、日本の音声認識市場を先駆者として拓いて行きました。

また、2013年辺りより第3次AIブームのきっかけとなったディープラーニング技術の採用で、他社の音声認識も音声データと対応するテキストデータを対で大量に学習させれば、自然発話に対応できるようになりました。しかしながら、このディープラーニング技術を加味した弊社のハイブリッド型の「AmiVoice®」は、大量のデータ対の学習が不要で、自然発話に高精度で対応できる、優れものにさらなる進化を遂げています。

その証左として、この6〜7年間、弊社は右肩上がりの成長を成し遂げており、音声認識のソフトウェア・クラウドサービス市場において、GAFAMや他の企業を抑えてシェアNo.1の地位を築いています。(※)

また、昨今「AI音声認識」がようやく世の中の認知を得られるようになってきましたが、創業当初から独自の音声認識に第2次のAI技術を取り込み、市場化の活動を経てそれを磨き、さらにディープラーニングをも取り込み、さらなる進化を成し遂げたことで、弊社がAI音声認識の元祖であり、かつ、その先駆者であると言っても過言ではないと思っています。

(※)出典:ecarlate「音声認識市場動向2023」音声認識ソフトウェア/クラウドサービス市場

ーー貴社の強みはどこにあるとお考えですか?

鈴木清幸:
弊社は設立から26年間の長きにわたって、ビジネス分野、即ち、ビジネス領域ごとに特化してデータを蓄積してきました。このデータ蓄積に基づき進化させた領域特化の高精度音声認識エンジンこそが弊社の強みです。

また、もう1つの強みはJUI(Joyful、Useful、Indispensable)戦略です。これは「一般消費者は、“楽しい(Joyful)”により使い始め、使い続けることで、なくてはならないものになる。また、ビジネスユーザーは“便利・役に立つ(Useful)”により使い始め、使い続けることで、“なくてはならない(Indispensable)”ものになる。」ということで、顧客を明確に意識し、顧客都合の階段を上って頂くことで普及させるというものです。

これにより、従来の音声認識のアプリケーションやサービス(アプリ/サービス)の販売といった動きを、お客様が利用を開始され、継続的に使われるようにするための、弊社側の一連の動きに変えるというBSR(Beyond Speech Recognition)のコンセプトに辿り着いたのです。これは顧客都合を考慮した導入から普及へと繋げる戦略であり、米国のMTLが成長を成し遂げられた要因の1つでもありました。

そして、これらの強みをもとに社会課題を解決するアプリ/サービスを開発し、拡げてきたことが他社との差別化のポイントであったと考えています。これからも、高度な技術を活用し、お客様にとって必要なものをいかに生み出すのかを考え、それを開発し、拡げて行くことで普及を成功させたいと思っています。

共育――行うべきことを明確にし、乖離を埋める努力でともに育つ

ーー貴社の経営理念や、大切にしている考え方はありますか?

鈴木清幸:
弊社が目指しているのは、「昨日のありえないを明日のアタリマエにする」集団づくりです。この不可能を可能にする集団化に必要なコトは目標駆動の耐動「GAP(Goal driving Actions with Perseverance)」とそれにより生み出す「共育(きょういく):Leader Players Growing Together(LPGT)」です。

集団を率いるリーダーが目標をつくり、行うべきことを明確にします。プレイヤー(集団の構成メンバー)はそれを実行します。そして、実行の結果と目標との乖離を埋めるためのリーダーの支援とプレイヤーのアクションの継続実行といったお互いの粘り強い努力により目標を掴むことが可能となります。

この継続的な回帰型のプロセスが「ともに育つ」へリードするわけです。この際、リーダーの支援とは教えることではなく、教わることが重要となります。プレイヤーに対してどのように伝えれば動いてくれるのかを教わるのです。これによりリーダーの伝える能力が育ちます。一方で、リーダーの伝えることをプレイヤーが目標との乖離を埋める効果的なアクションに変換するには受け取る能力を必要とします。この体験を通じてプレイヤーの受け取る能力も育つのです。

AIによるシステムの進化と未来

ーー貴社の今後のビジョンを教えてください。

鈴木清幸:
弊社のビジョンは「音声によるAIやコンピュータとの自然なコミュニケーションを実現することで社会の必要に応えること」です。これを「HCI(Human Communication Integration)の実現」というフレーズで表現してきました。

お陰様で、これまでの市場化の活動によりビジョン実現への“階段”がハッキリ見えてきた気がしています。まずは、「AmiVoice® Cloud Platform(ACP)」などの領域特化の高精度音声認識エンジンのプラットフォームを基盤として、これまで市場投下してきたアプリ/サービスを、DXプラットフォームなどの目的を明確にしたプラットフォームにすることで、利用者の増大による売上規模の拡大を考えています。

今後、DXプラットフォームのアプリ/サービスとして本格的に導入、そして、普及を進めるのが、スマホでのフリック入力を音声により効率化・快適化する「SBX(スピーチボード)」、そして、PCでのキーボード入力を音声により効率化・快適化する「声キーボード」、更には、PCでのマウス操作を音声により効率化・快適化する「声マウス」です。これらは、仕事の相棒、即ちAIパートナーで、利用者が音声プロンプトを教え、利用者の適時適所での発話により利用者が効率化や快適化といった効能を得られるというものです。またこれらは、あらゆるアプリケーションに対して内蔵することを必要とせずに利用することができます。

この「AmiVoice® DX Platform(ADP)」により、日本の喫緊の課題であるDX促進に貢献し、弊社も発展していけたらと考えています。

編集後記

AIの普及に情熱を注ぐ中、その問題点にいち早く気づいていた鈴木清幸社長。

分野特化のAI音声認識の普及を経て、愈々、本懐であるAIの普及に挑む株式会社アドバンスト・メディアはこれからもトップを走り続けるだろう。

鈴木清幸(すずき・きよゆき)/1978年、京都大学大学院工学研究科博士課程を中途退学し、東洋エンジニアリング株式会社に入社。1986年、株式会社インテリジェントテクノロジー入社。カーネギーグループ主催のKECP(Knowledge Engineer Cultivation Program/知識工学エンジニア養成プログラム)を修了し、知識工学者に認定。1997年に、株式会社アドバンスト・メディアを設立し代表取締役社長に就任。2010年に代表取締役会長兼社長代表執行役員に就任。