
ChatGPTや生成AIという言葉が世間をにぎわせている。現在は2010年代前半から始まった第3次AIブームのさらなるAIブームの勃興ともいえる。IDCの示したデータによると、国内AI市場の成長予測は2022年から2027年においてCAGR(年平均成長率)23.2%と言われている。
そういった時流の中、AI音声認識「AmiVoice®(アミボイス)」を組み込んだアプリケーションを提供し、さまざまな企業から注目されているのが株式会社アドバンスト・メディアだ。
代表取締役会長兼社長である鈴木清幸氏から、音声認識事業に着手するきっかけや、サービスの詳細、今後の展望について話を聞いた。
米国での運命的な出会い
ーー貴社のビジネスが始まったきっかけを教えてください。
鈴木清幸:
私は、約40年前に第2次AIブームに乗り創業された株式会社インテリジェントテクノロジーに入社後、提携関係にあったカーネギーメロン大学(CMU)のスピンオフカンパニー・カーネギーグループ社に派遣され、第2次AIを学び日本へ普及させる活動に勤しんでいました。
そのような中で、AIの一分野であった音声認識の研究において当時の中心メンバーらとCMUのAI研究の中核機関であったロボティックス研究所で出会い、私の描いた夢に彼らが乗ってきてくれたことをきっかけに、彼らとともに日本と米国における音声認識の同時市場開拓を目的とした事業を始めました。CMUで出会った彼らは、DARPA(※1)が主催する音声認識の競技会で2年連続優勝という華々しい実績を有していました。
一方、当時の私はAIの普及に勤しみながらも、キーボードでAIへの指示を入力する方法では普及が難しいのではないかとも考えていました。そのような中で、彼らとの出会いにより音声認識を用いることでのAIの普及に大きな可能性を見出したのです。まずは、音声認識の市場開拓を成功させ、そして、AIの普及へとつなげようと考えました。
1997年11月に彼らに米国でISIという会社を設立させ、1997年12月に私が日本で弊社を設立しました。ここに、日米協働で音声認識の市場化の事業開発という前代未聞のプロジェクトが始まったのでした。
(※1)DARPA(Defense Advanced Research Projects Agency):アメリカ合衆国の国防総省に所属し、高度な研究プロジェクトを推進するために設立された独立機関。
戦略的な投資がもたらした成長
ーー困難な状況があったと思いますが、どのように乗り越えられましたか?
鈴木清幸:
彼らが設立したISIが、2000年にベルギーで興り米国で大きく成長した音声認識の会社に買収されてしまいました。ISIは弊社が目指す音声認識の市場化にとって極めて重要な会社ですから、まさに危機でした。
そこで、2001年に弊社が資金提供し、筆頭株主の新会社MTL(Multimodal Technologies, LLC.)を米国に設立し、MBO(経営陣による買収のこと)によりISIを買い戻しました。この結果、ISIはなくなりましたが、ISIを買取ることで、逆に弊社の事業成長の可能性がより高まったのでした。
その後、MTLの時価総額を10年間で40倍に増大させることができました。2011年にMTLの株式を売却し、その資金の一部を使い、現在の弊社の業績が右肩上がりとなる成長構造の土台づくりに成功しました。
AI音声認識「AmiVoice®」を活用した多彩なサービスを提供

ーー貴社の「AmiVoice®」について教えてください。
鈴木清幸:
「AmiVoice®」とは、音声をテキスト化する大規模語彙連続音声認識に第2次AIの知識表現技術を取り入れた弊社独自の音声認識技術のことです。発話に対して、音響モデルの分析結果に基づき認識デコーダが大規模言語モデル(LLM)を用いてテキストに変換する技術が音声認識です。弊社は利用者による事前の学習(エンロールメント)を要せずに利用者の発話を処理できる不特定話者対応という当時他社が真似られないAI音声認識「AmiVoice®」を開発し、日本の音声認識市場を先駆者として拓いてきました。
2013年頃から、第3次AIブームのきっかけとなったディープラーニング技術の採用によって、対応する音声とテキストのデータを大量に学習させれば、他社でも音声認識ができるようになりました。しかしながら、伝統的な音声認識技術にこのディープラーニング技術を取り入れた弊社のハイブリッド型の「AmiVoice®」は、大量のデータ学習が不要で、高精度な音声認識を実現する“優れもの”にさらなる進化を遂げています。
その証左として、この6〜7年間、弊社は右肩上がりの成長を成し遂げており、音声認識のソフトウェア・クラウドサービス市場において、GAFAMや他の企業を抑えてシェアNo.1の地位を築いています。(※2)
また、昨今「AI音声認識」がようやく世の中の認知を得られるようになってきましたが、創業当初から独自の音声認識に第2次のAI技術を取り込み、市場化の活動を経てそれを磨き、さらにディープラーニングをも取り込み、さらなる進化を成し遂げたことで、弊社がAI音声認識の元祖であり、かつ、その先駆者であると言っても過言ではないと思っています。
(※2)出典:合同会社ecarlate「音声認識市場動向2025」音声認識ソフトウェア/クラウドサービス市場
ーー具体的にどのようなサービスを提供していますか。
鈴木清幸:
たとえば、弊社では「AmiVoice®」の技術を活用した営業力強化プラットフォーム「AmiVoice SalesBoost(アミボイス セールスブースト)」を提供しています。これには、営業担当者がAIによるロールプレイを通してセルフトレーニングができる「AmiVoice® RolePlay(アミボイス ロールプレイ)」やAIを用いた商談要約・分析ができる「AmiVoice® SF-CMS(アミボイス エスエフシーエムエス)」などがあります。
また、コンタクトセンター向けのサービスとして、機密情報も安心して扱える生成AIサービス「AOI LLM for AmiVoice Communication Suite(アオイ エルエルエム フォー アミボイス コミュニケーション スイート)」(※3)も提供しています。このサービスにより、コンタクトセンター側は機密情報が含まれる通話データを一切外部に漏らすことなく、ローカル環境で通話内容の生成要約やQ&Aの抜粋、お客様の声の抽出などが可能となります。
同サービスは、現在コンタクトセンター向けに提供していますが、今後は建設業など業界ごとにパーソナライズしたものを開発・提供していく予定です。
そのほか、生成AIの利活用を促進する「AmiVoice VM(アミボイス ブイエム:声マウス)」と「AmiVoice VK(アミボイス ブイケー:声キーボード)」があります。これらは、利用者が仕事の効率を上げるために、自らカスタマイズできるパーソナライズAI(特許取得済み)です。音声プロンプトや音声入力により、AIにマウス操作やキーボード操作を代行させることで、ドキュメント作成やデータ生成などの効率化と、AIが仕事を手伝ってくれるという、今までにない新たな体感が生み出す快適さを得ることができます。
(※3)AOI(アオイ:アミボイス オントロジー融合、AmiVoice Ontology Integrated)アミボイスに第2次AIの技術を融合させたということ。
ーー貴社の強みはどこにあるとお考えですか?
鈴木清幸:
弊社は、設立から28年間の長きにわたって、ビジネス分野、すなわち、ビジネス領域ごとに特化してデータを蓄積してきました。このデータの蓄積に基づき進化させた領域特化の高精度音声認識エンジンこそが弊社の強みです。
また、もう1つの強みはJUI(Joyful、Useful、Indispensable)戦略です。これは「一般消費者は、“楽しい(Joyful)”により使い始め、使い続けることで、なくてはならないものになる。また、ビジネスユーザーは“便利・役に立つ(Useful)”により使い始め、使い続けることで、“なくてはならない(Indispensable)”ものになる。」ということで、プロダクトアウトで開発された製品をマーケットインで市場化することで、普及させるというものです。
これにより、従来の音声認識のアプリケーションやサービス(アプリ/サービス)の販売といった動きを、顧客が利用を開始し、継続的に使うようにするための、弊社側の一連の動きに変えるというBSR(Beyond Speech Recognition)のコンセプトに辿り着いたのです。これは、顧客側の都合を考慮し、製品を導入から普及へと繋げる戦略であり、米国のMTLが成長を成し遂げられた要因の1つでもありました。
そして、これらの強みをもとに社会課題を解決するアプリ/サービスを開発し、拡げてきたことが他社との差別化のポイントであったと考えています。これからも、高度な技術を活用し、お客様にとって必要なものをいかに生み出すのかを考え、それを開発し、拡げていくことで音声認識の市場化を成功させたいと思っています。
共育――行うべきことを明確にし、乖離を埋める努力でともに育つ
ーー貴社の経営理念や、社長として大切にしている考え方はありますか?
鈴木清幸:
弊社が目指しているのは、「昨日のありえないを明日のアタリマエにする」集団づくりです。この不可能を可能にする集団化に必要なコトは目標駆動の耐動「GAP(Goal driving Actions with Perseverance)」とそれにより生み出す「共育(きょういく):Leader Players Growing Together(LPGT)」です。
集団を率いるリーダーが、目標をつくり、行うべきことを明確にします。プレイヤー(集団の構成メンバー)はその目標を達成する動きを実行します。そして、実行の結果と目標との乖離を埋めるために、リーダーの支援とプレイヤーのアクションの実行を粘り強く継続するのです。
このお互いの役割を意識した、粘り強い継続的な動きが「ともに育つ」へリードするわけです。この際、リーダーには伝える能力の養成、プレイヤーには受け取る能力の養成が必要となります。リーダーが、目標からの乖離を埋める効果的な動きをプレイヤーに伝えようとしても、伝え方が下手であればプレイヤーは動きません。また、伝え方が上手くても、プレイヤー側に受け取る能力がなければ動かないからです。伝える能力の養成に重要なことは、「教えるのではなく、教わる」です。プレイヤーに対して、どのように伝えれば動いてくれるのかを教わるのです。これにより、リーダーの伝える能力が育ちます。この体験を通じて、プレイヤーの受け取る能力も育つのです。
AIによるシステムの進化と未来
ーー貴社の今後のビジョンを教えてください。
鈴木清幸:
弊社のビジョンは、「音声によるAIやコンピュータとの自然なコミュニケーションを実現することで、社会が必要とする持続可能性に応えること」です。これを、「HCI(Human Communication Integration)の実現」というフレーズで表現してきました。
お陰様で、これまでの市場化の活動により、ビジョン実現への“階段”がハッキリ見えてきた気がしています。まずは、「AmiVoice® Cloud Platform(ACP)」などの領域特化の高精度音声認識エンジンのプラットフォームを基盤として、これまで市場投下してきたアプリ/サービスを、DXプラットフォームなどの目的を明確にしたプラットフォームにし、従量利用を可能にすること(特許取得済み)で、利用者の増大による売上の拡大を行います。
そして、先述の声マウスや声キーボードなどのAOIエージェントやAOI LLMなどをプラットフォーム化したAOIプラットフォームにより、仕事の効率化とAIを相棒とした仕事の快適化を促進することで、さらなる売上の拡大を目論んでいます。
また、世の中のWebサイトをアドバンストサイトにすることでもさらなる売上の拡大を目指す予定です。これは、Webサイトに提供するアドバンストコミュニケーション(特許取得済み)とオンラインマッチングのサービス「AmiVoice EV(アミボイス イーブイ:Easy Viewer)」により、オウンドメディアであるWebサイトのメディア価値を高めるものです。
弊社は、音声認識やAIを活用したさまざまなアプリケーションやサービスを提供するばかりでなく、それらの利活用スキルをも伝授し、社会のサステナビリティをプロデュースすることを目指しています。AIは、人の仕事を奪うのではなく相棒となりお互いを高め合う存在です。人が、そのようなAIにより、自身、あるいは、属する集団、そして、社会のサステナビリティをプロデュースすることでより良い社会の実現が可能であると考えております。
編集後記
追い風が吹いているこの市場で、生成AIの技術を活用し、多岐にわたるサービスを展開しているアドバンスト・メディア。分野特化のAI音声認識の普及を経て、愈々、本懐であるAIの普及に挑む鈴木社長の次の一手が楽しみだ。

鈴木清幸(すずき・きよゆき)/1978年、京都大学大学院工学研究科博士課程を中途退学し、東洋エンジニアリング株式会社に入社。1986年、株式会社インテリジェントテクノロジー入社。カーネギーグループ主催のKECP(Knowledge Engineer Cultivation Program/知識工学エンジニア養成プログラム)を修了し、知識工学者に認定。1997年に、株式会社アドバンスト・メディアを設立し代表取締役社長に就任。2010年に代表取締役会長兼社長代表執行役員に就任。