アミボイスの料金は?API利用から専用環境の構築まで費用相場を分かりやすく整理

アミボイスの料金は?API利用から専用環境の構築まで費用相場を分かりやすく整理

目次

AmiVoice(アミボイス)は、株式会社アドバンスト・メディアが提供する音声認識ソリューションです。「API」「専用環境(Private)」「SDK」「パッケージ製品」と提供形態が複数あり、料金の見方がそれぞれ異なります。

この記事では、APIの従量課金の仕組みと単価、無料枠の活用法、医療・金融・保険といった業界特化エンジンのコスト判断、Privateやオンプレミスの費用構造、SDKのライセンス料、パッケージ製品の価格まで、導入検討に必要な情報を紹介します。

本記事の料金情報は2026年3月時点の公式サイト記載内容に基づきます。料金は改定される可能性があるため、最新情報は必ず公式サイトでご確認ください。

この記事のポイント
  • 料金体系:APIは従量課金、パッケージ製品は買い切り+保守費、SDKはライセンス料の3タイプ
  • 月額目安:API利用量による(無料枠:エンジンごとに月60分)
  • 初期費用:APIはなし(無料枠から開始可)。Keyboard等パッケージは本体+設置費で数十万円〜
  • 無料トライアル:あり(AmiVoice APIはエンジンごとに月3,600秒の無料枠)
  • 最低契約期間:APIは不明(従量課金のため事実上なし)。パッケージ・SDKは要問い合わせ
  • コスパが良いケース:月間音声量が少ない・PoCから始めたい場合はAPI。長期・大量利用ならパッケージ・SDKも比較を

まずあなたはどちらかチェック

AmiVoiceを調べ始めると「結局どれがいくら?」と迷う方が少なくありません。その理由は、AmiVoiceが単一の製品ではなく、用途と立場によって選ぶべきサービスがまったく異なるためです。まず自分がどちらに当てはまるかを確認してください。

ユーザータイプ 目的 向いている製品 この記事での参照先
ビジネスユーザー 会議の録音・文字起こし・議事録作成を効率化したい ScribeAssist、ProVoXT、AmiVoice Keyboard 「開発不要ですぐに導入できる製品とアプリの料金」セクション
開発者・SI事業者 自社システムやアプリに音声認識を組み込みたい AmiVoice API、API Private、SDK 「AmiVoice Cloud Platform(API)の料金プラン」セクション

 

パッケージ製品(ScribeAssistやKeyboard)はシステム開発不要ですぐに使い始められます。API・SDKはエンジニアが自社システムへ組み込む前提の製品です。どちらに当てはまるかを先に確認してから、該当するセクションを読み進めてください。

アミボイスを導入する際にかかるコストの全体像

アミボイス導入時に発生するコストは、大きく4つの区分に分けて整理しました。

コスト区分 内容の例
利用料(従量・定額) API従量課金、ライセンス月額、アプリ月額など
初期費用 導入支援・設定・インフラ構築費(要件次第で発生)
運用費 監視・辞書チューニング・品質改善工数など
周辺機器費 専用マイク・iPad・Wi-Fiルーターなど

API(従量課金)では利用料が中心になりますが、Keyboardや現場アプリ系では本体価格に加えて保守費・導入設置費・周辺機器費が発生します。初期費用だけで比較するのではなく、運用全体のトータルコストで判断することが重要です。

サービスによって異なるアミボイスの種類と特徴

主なサービスラインナップをまとめると以下のとおりです。

サービス区分 対象 料金の形
AmiVoice API 開発向け(クラウド) 従量課金(単価表あり)
AmiVoice API Private 開発向け(専用環境・オンプレ) 個別見積
AmiVoice SDK 開発向け(オフライン・組み込み) ライセンス料
AmiVoice Keyboard 開発不要(Windows PC向け) 買い切り+保守
業務アプリ(スーパーインスペクション等) 現場向け 月額+ライセンス

どれを選ぶかで「単価表が存在するか・しないか」「見積が必要か」「周辺機器費が別途発生するか」が変わります。自社の開発体制・セキュリティ要件・利用規模を踏まえて、まずサービス区分を絞ることが料金把握の第一歩となります。

月額制や従量課金など支払い方式による違い

AmiVoice APIは従量課金のクラウド型サービスです。「従量」とは発話区間のみ課金される仕組みで、使った分だけコストが発生します。一方、KeyboardやSDKは「買い切り」の性格が強く、初期費用が大きい分、長期利用で安定したコストになる傾向があります。

  • 従量課金:使った分(発話区間・秒単位)のみ費用が発生。小規模スタートに向いている。つまり、いきなり大きなコストをかけずにPoC(概念検証)を始められます
  • 月額制:ライセンス料やストレージなど固定費が中心。予算が読みやすい
  • 買い切り:初期費用が大きく、保守費が別途発生するケースが多い

なお、公式FAQによると、AmiVoice APIには完全定額プランは存在しないものの、利用時間が大きい場合は相談次第で「定額従量課金」に対応できるケースもあるとされています。大量利用を見込む場合は、導入前に問い合わせてみる価値があるでしょう。

予算を見積もる前に決めておくべき運用条件

料金を正確に試算するには、事前に運用条件を固めておくことが欠かせません。以下の項目を社内で確認してから次のステップに進むことをおすすめします。

  • 用途(会議録・コールセンター通話記録・医療記録・現場メモ など)
  • 処理方式(リアルタイム認識 or バッチ処理)
  • ログ保存の可否(社内規程・個人情報保護の観点で決定が必要)
  • 対象言語(日本語のみ・多言語混在 など)
  • 月あたりの音声時間の見込み
  • 同時処理の有無と規模
  • セキュリティ要件(閉域ネットワーク・オンプレミスが必要か)

AmiVoice APIでは、一つのAppKeyを複数のデバイスで共有して利用できます。ただし、標準設定では同時リクエスト数(スロット数)に上限が設けられている点に注意が必要です。上限を超える大規模な運用を想定している場合は、事前に上限緩和の申請を行う必要があります。

【開発者向け】AmiVoice Cloud Platform(API)の料金プランと課金の仕組み

AmiVoice APIは、開発者が音声認識機能を自社サービスやシステムに組み込むためのクラウド型APIです。「結局いくらかかるのか」を自分で計算できるように解説します。

重要:2025年10月1日に公式の料金値下げが実施されています。第三者サイトや古い記事には改定前の単価が掲載されているケースがあるため、単価は必ず公式価格表(https://acp.amivoice.com/amivoice_api/price/)で最新情報を確認してください。

毎月設定されている無料枠の範囲と賢い使い方

AmiVoice APIでは、すべてのエンジン・感情分析オプションについて毎月60分(3,600秒)の無料枠が設けられています。この無料枠は「全エンジン合算で60分」ではなく、エンジンごとに3,600秒が差し引かれるという計算ルールになっています。つまり、費用をかけずに複数エンジンで実際の業務音声を試してから、本番環境で使うエンジンを決められます。

検証フェーズでの活用方法としては、次のような順序が考えられます。

  • まず汎用エンジンで音質・話速・雑音耐性を確認する
  • 業界エンジン(医療・金融・保険)で専門語の認識精度を確かめる
  • ログ保存あり・なしを切り替えて動作の違いを検証する

注意点として、無料枠を超えた際に通知は届きません。マイページの「今月の使用量」を定期的に確認する必要があります。気づかないうちに課金が始まっていたというケースを避けるためにも、定期確認を運用ルールに組み込むことをおすすめします。

発話した時間だけが課金対象になる理由

AmiVoice APIの課金対象は発話区間のみです。無音の時間には料金がかかりません。課金単位は1秒単位での計算となります。

ただし、いくつかの注意点があります。

  • BGMやテレビ音声、隣席の声などが混入すると、それらが発話区間として認識される可能性があります
  • 保留音は基本的に課金対象外とされていますが、環境音が大きい場合は発話区間扱いになるケースもあります
  • 雑音が多い環境で利用する場合は、実際の課金額が想定より増える可能性があります

料金の計算フローは「①月間の発話秒数を集計→②無料枠(3,600秒)を差し引く→③単価を乗算→④1円単位で四捨五入→⑤合計50円未満の場合は請求なし」となっています。

リアルタイム認識とバッチ処理でコストを最適化する方法

AmiVoice APIには3つのインターフェースがあり、用途によって適切な選択肢が異なります。インターフェースの選択はコスト最適化にも直結します。

インターフェース 主な用途 特徴
WebSocket リアルタイム認識 音声をストリームで送信。会議・コールセンター等に適している
同期HTTP 即時変換 短い音声ファイルを送信して結果を受け取る
非同期HTTP 大量バッチ処理 大量の音声ファイルをまとめて処理する用途に向いている。つまり、録音済みデータを夜間にまとめて処理するような運用でコストを抑えられます

汎用エンジンではWebSocket・同期HTTPと非同期HTTPで単価に差が設けられています。バッチ処理が中心の用途であれば、非同期HTTPを選ぶことでコストを抑えられる可能性があります。

ただし、非同期HTTPを利用する場合は、処理中にサーバー側へ音声ファイルが一時保存されるケースがあります。セキュリティ要件が厳しい場合は事前に確認が必要です。

音声ログの保存設定が利用料金に与える影響

AmiVoice APIの料金体系で最も重要な分岐点のひとつが、ログ保存の設定です。

  • ログ:音声データと認識結果のこと
  • ログ保存あり:株式会社アドバンスト・メディアが研究開発・品質向上目的でログを利用することに同意した場合。単価が低めに設定されている
  • ログ保存なし:サーバー側にファイルとして保存されず、メモリ処理後に消去される。つまり、社内規程でデータの外部保存が禁止されている環境でも利用できます。単価はログ保存ありより高くなる

ログ保存の選択は「料金だけの問題」ではなく、社内の情報セキュリティ規程や個人情報保護法の対応方針とセットで判断する必要があります。医療・金融など機微情報を扱う業界では、この選択が運用設計の核心になります。

【開発者向け】業界特化型エンジンの選び方と料金が変わる基準

AmiVoice APIには汎用エンジンのほか、医療・金融・保険・多言語に特化したエンジンが用意されています。特化型エンジンは単価が高めになりますが、「高いから選ばない」ではなく「費用対効果」で判断するのが正しいアプローチです。専門語の誤認識が減れば、後工程の修正コスト・業務リスクが下がり、トータルコストが逆に低くなるケースも少なくないからです。

汎用エンジンが適しているケースとメリット

汎用エンジンは最もコストが低く、まず試してみるべき入口として位置づけられます。汎用エンジンで十分なケースの判断基準は次のとおりです。

  • 専門用語の比率が低い(一般会話・社内会議・議事録など)
  • 固有名詞が少ない、またはあっても辞書登録・単語登録で対応できる
  • 認識精度が多少落ちても、後工程での修正コストが低い

単語登録機能を使えば、汎用エンジンでも固有名詞の認識精度を一定程度高めることが可能です。まず汎用エンジンで無料枠を活用しながら精度を確認し、不十分であれば業界エンジンへ移行するという段階的な判断をおすすめします。

医療向けエンジンが専門性を要する理由と費用感

医療向けエンジンは、病状・病名・薬品名・手術名など医療専門用語を高精度で認識することを目的として設計されています。「精度を買う」という観点で選択されるエンジンです。

注意:医療エンジンは2025年10月1日の値下げで特に大きく単価が変更されています。ITトレンドなどの第三者サイトには旧単価が残っている可能性があるため、必ず公式価格表で最新単価を確認してください。

医療分野ではログ保存の設定が特に重要な論点になります。患者情報を含む音声を処理する場合、院内の個人情報保護方針・監査要件との整合性を先に確認したうえで、ログ保存あり・なしを選択することが求められます。

金融や保険業界での導入で検討すべきコストバランス

金融エンジン・保険エンジンは、株式・証券・為替・保険契約・特約といった業界固有の専門語を高精度で認識するよう設計されています。汎用エンジンとの単価差は存在しますが、重要な判断軸は「誤認識が業務リスクに直結するか」です。

コールセンターの通話記録に誤認識が混入した場合、後工程での確認・修正に人的コストが発生します。金融取引に関わる内容であれば、誤記録が業務上のリスクになる可能性もあります。業界エンジンによって誤認識率が下がれば、その分の人件費と業務リスクが削減できるという計算が成り立ちます。

2025年10月1日の料金改定では、金融・保険エンジンにおいても単価の見直しが行われています。古い情報との比較で費用判断をしないよう、公式ニュース(https://acp.amivoice.com/news/news/2025/10/01/7676/)の改定内容を確認することをおすすめします。

多言語対応を検討する際に把握しておくべき追加費用

多言語エンジンは、日本語・英語・中国語が発話の中に混在していても文字に起こせる機能を持っています。料金表に掲載された単価以外にも、運用上のコストが発生する可能性があります。

  • 言語判定の精度:言語が混在する割合が高いと、誤認識が増えるリスクがある
  • 後処理工数:認識結果を翻訳・整形する場合、追加の人的・システム的コストが発生する
  • 混在率の管理:どの言語がどの割合で出現するかの把握が精度管理に必要

【開発者向け】セキュリティ重視の専用環境AmiVoice API Privateで発生する費用

AmiVoice API Privateは、クラウドの共用環境ではなく自社専用のインスタンスまたはオンプレミス環境で音声認識を運用したい場合に選択するサービスです。定価での単価表は公開されておらず、利用形態に応じた個別見積となります。

構成 発生する費用の種類
クラウド専用インスタンス API利用料+専用インスタンス利用料(初期費用は要件次第で発生)
オンプレミス 音声認識サーバーライセンス料+サーバー保守・サポート料(個別見積)
カスタマイズ開発を含む場合 上記に加えて開発費・期間(目安:2ヶ月前後)が発生

自社専用のクラウド環境を構築する際の主なコスト要因

専用インスタンスを構築する場合は初期費用が要件次第で発生します。初期費用が生じる代表的な理由は、性能要件(同時処理数・レイテンシ)・可用性要件(冗長化構成)・ネットワーク要件(閉域接続・VPN設定)です。

なお、Privateの場合「API利用料」と「専用インスタンス利用料」の2つが並ぶ点に注意が必要です。これは二重課金ではなく、ソフトウェアの利用料と専用リソースの占有コストを合わせた内訳です。

ネットワーク分離環境でオンプレミスを選択した場合の費用項目

オンプレミス構成を選ぶ主な理由は、閉域ネットワーク要件・業界規制・データ持ち出し不可のポリシーなどです。つまり、クラウドへの接続が一切許可されない環境でも音声認識を利用できます。この場合、音声認識サーバーライセンス料・サーバー保守・サポート料が発生し、いずれも個別見積となります。

見積を依頼する際に必要な情報としては、以下が挙げられます。

  • CPU・メモリなどのサーバースペック要件
  • 同時処理数(同時に何チャンネルの音声を処理するか)
  • 音声ソース(マイク・電話・録音ファイル など)
  • 対象言語・エンジンの種類
  • ネットワーク構成(閉域・インターネット経由 など)

個別見積もりが必要なカスタマイズ開発の判断基準

公式によると、標準ラインナップ以外のエンジンが必要な場合はカスタマイズ開発が可能です。カスタマイズには「2ヶ月前後の期間と費用」「学習させたいテキストデータ」が必要とされています。

カスタマイズ開発を検討すべき判断基準の例は以下のとおりです。

  • 業界固有の専門語が多く、標準エンジンでは認識精度が不十分
  • 誤認識が業務上のリスクや損失に直結する
  • 特定のフレーズや命令語を固定パターンで認識させたい(ルールグラマの活用)

カスタマイズ費用のROIを概算する方法として、「誤認識修正にかかる時間(分)× 月間件数 × 人件費単価(円/分)」で月間の修正コストを算出し、カスタマイズ費用の回収期間を見積もるアプローチが有効です。

【開発者向け】組み込みやオフライン環境で活用するAmiVoice SDKのライセンス料

AmiVoice SDKは、インターネット接続が不要なオフライン環境や組み込み機器への音声認識機能の実装を目的としたソフトウェア開発キットです。つまり、完全にインターネットから切り離された環境でも音声認識を実装できます。APIのような従量課金ではなく、ライセンス制が採用されています。

公式によると、SDKは「開発ライセンス」と「商用ライセンス」の2段階で構成されています。開発ライセンスの価格は55万円(ライセンス費・初年度保守費込み)と公式に明示されています。商用ライセンスは個別見積です。

開発時と商用リリース時で異なるライセンス形態

開発ライセンスには、「無期限ではあるものの、検証・開発期間中は3ヶ月ごとにライセンスキーの更新作業が必要」という運用ルールがあります。商用リリースのスケジュールから逆算して早めに問い合わせることをおすすめします。

対応OSやアプリの数によって変動する費用の注意点

SDKのライセンスは「1OS・1アプリケーションに対し1ライセンスが必要」という仕様です。端末台数ではなく「OS × アプリ」の組み合わせでライセンス数を数える点で、見積時に見落としが起きやすい箇所です。

【ビジネスユーザー向け】開発不要ですぐに導入できるアミボイス専用製品とアプリの料金

APIやSDKはシステム開発が前提ですが、AmiVoiceには開発不要ですぐに使い始められる製品も用意されています。議事録作成の効率化が目的であれば、まずこちらの製品を検討してください。

AmiVoice Keyboardの本体価格と保守サポートの仕組み

AmiVoice Keyboardは、WindowsPC上で音声入力をキーボードの代わりに使える製品です。公式が明示している価格は次のとおりです。

費用項目 金額(税別)
本体(通常プラン、初年度保守込み) 240,000円(税込 264,000円)
次年度以降の保守費 年 40,000円/ライセンス
導入設置作業費(最大10台) 別途見積
専用マイク 別途

導入設置作業費は、インストール作業と現場でのパラメータ調整が含まれます。本体価格だけを見て予算を組むと、設置費や保守費を見落とします。総額で比較することが重要です。

保守サービスの内容としては、問い合わせ対応・端末入替対応・アップデート提供などが含まれています。保守費用の裏にある安心材料として、稟議資料に明記しておくと評価されやすいでしょう。

現場向けモバイルアプリで発生する月額料金とライセンス料

建築工程管理向けのAmiVoiceスーパーインスペクションプラットフォームは、現場作業員がスマートフォンやタブレットで音声入力を行うための業務アプリです。つまり、現場でのメモ作業を音声で完結させることができます。公式価格の概要は以下のとおりです。

費用項目 料金
基本利用料(ストレージ20GB含む) 月額 3,000円(税別)
ストレージ追加(5GBあたり) 別途料金
アプリライセンス 月額(種別による)

注意点として、ストレージサービスのみの契約は不可とされています。利用に必要な機材としては、iPad/iPhone・Wi-Fiルーター・ヘッドセットマイク・PCが挙げられます。これらの周辺機器費もコスト試算に含める必要があります。

API開発かパッケージ導入かどちらが安く済むかの判断材料

比較軸 AmiVoice API パッケージ(Keyboard等)
導入スピード 開発期間が必要 比較的早い
カスタマイズ余地 高い 限定的
初期費用 低め(無料枠PoCから開始可) 本体+設置で数十万円〜
運用コスト 従量で変動する 保守費が固定で読みやすい
セキュリティ要件への対応 Private/SDKへ拡張可 製品仕様に依存

まず無料枠でPoCを実施して要件を固めてから、Private・SDK・パッケージも含めて比較検討するのが、失敗しないための確実なステップです。

失敗しないアミボイスの選び方と導入コストを抑える手順

株式会社アドバンスト・メディアは公式ニュース・プレスリリースで、通信の暗号化・プライバシーマーク取得・FTR認定・ISMS認証などを掲示しています。これらは「料金の安さ」ではなく「採用判断の根拠」として、社内セキュリティ審査の材料にしてください。

セキュリティ要件の厳しさで変わる最終的な支払い額

セキュリティ水準 想定されるサービス 費用の形
ログ保存なし(標準API) AmiVoice API(ログなし設定) 単価高め・定額的
ログ保存あり(標準API) AmiVoice API(ログあり設定) 単価低め
閉域・専用環境が必要 API Private(専用インスタンス) 個別見積
データ持ち出し不可・オンプレ必須 API Private(オンプレ) or SDK 個別見積

社内稟議をスムーズに進めるための要件チェックリスト

確認項目 記入欄
用途  
対象部門  
月間音声時間の見込み(時間)  
処理方式 WebSocket/同期HTTP/非同期HTTP
ログ保存の可否  
対象エンジン 汎用/医療/金融/保険/多言語
同時処理の有無と規模  
データ保存要件 閉域/オンプレ 等
問い合わせ窓口・担当者  

無料枠での技術検証から本番運用へ移行する流れ

  • 無料枠で精度確認:汎用エンジンから始め、業界エンジンも60分ずつ試す
  • インターフェース選定:リアルタイムかバッチかを決め、WebSocket・同期HTTP・非同期HTTPを選ぶ
  • ログ保存方針の決定:社内セキュリティ規程に照らして選択する
  • 月額試算:月間発話秒数×単価(無料枠控除後)で費用を概算する
  • PoC実施:本番に近い環境でテストを実施する
  • 本番移行:必要に応じてPrivate・SDKへの移行も検討する

よくある質問

議事録作成の効率化が目的です。APIとScribeAssistのどちらを選べばいいですか?

システム開発なしですぐ使いたい場合はScribeAssist一択です。APIはエンジニアが自社システムへ音声認識を組み込む前提の製品で、議事録作成担当者が直接使うものではありません。「会議を録音して文字起こし・議事録を作る」という目的であれば、ScribeAssist(スタンドアローン・オフライン対応)またはProVoXT(クラウド・チーム共有)を検討してください。

無料枠だけでどのくらい検証できますか?

エンジンごとに月60分(3,600秒)の無料枠があります。たとえば汎用エンジンで30分、医療エンジンで30分と使い分けることも可能です。実際の業務音声で試せる十分な枠があるため、「まず無料枠でPoCを実施してから判断する」という進め方が現実的です。ただし使用量の通知がないため、マイページで残量を定期確認する習慣が必要です。

月の利用量が予測しにくいのですが、どう試算すればいいですか?

「週あたりの会議時間×4週間×発話割合」が月間発話秒数の目安になります。1時間の会議で実際に人が話している時間は概ね30〜40分程度であることが多いため、会議時間の60%を発話時間として計算すると現実に近い試算になります。無料枠期間中に実際の発話秒数をAPIレスポンス(starttime/endtimeの差分)で計測しておくと、本番移行後の費用試算の精度が上がります。

2025年10月の値下げ後、実際にどのくらい安くなりましたか?

特に医療エンジンで大きな値下げがあったことが公式ニュースで確認できます。具体的な改定前後の比較数値は公式の改定ページ(https://acp.amivoice.com/news/news/2025/10/01/7676/)に掲載されています。第三者サイトや比較記事には改定前の古い単価が残っているケースがあるため、必ず公式価格表で現行単価を確認してください。

ログ保存ありとなしで、具体的にどのくらい料金差がありますか?

エンジンや処理方式によって差の幅は異なりますが、ログ保存ありの方が単価は低く設定されています。正確な差額は公式価格表(https://acp.amivoice.com/amivoice_api/price/)で確認してください。社内の情報セキュリティ規程でデータの外部保存が禁止されている場合はログ保存なしを選ぶ必要があるため、料金の前に規程の確認が先です。

関連記事