僕は音声入力のために、Aqua Voice(アクアボイス)を半年間使い続けています。結論から言うと、精度とコスパで選ぶなら現時点で最強の選択肢です。
頭の中では答えが出ているのに、キーボードで打ち込む時間がもどかしい。AIツールを日常的に使っていると、入力速度がボトルネックになる瞬間があります。
その解決策として、最近評判となってきているアクアボイスによる音声入力は最適です。
こちらの記事では、 AquaVoiceのProプランを1ヶ月無料でお試しできるプロモーションコードも紹介しておりますので、ぜひご覧ください。

この記事では実体験をベースに、料金・精度・機能を整理し、Wispr Flow・Superwhisperとの比較もまとめました。音声入力と思考整理の相性やメリットについてはこれらの記事でも触れています。
Aqua Voiceとは?開発元と基本スペック
Y Combinator出身のスタートアップが開発した、49言語対応のAI音声入力ツールです。独自モデル「Avalon」が音声認識の精度ランキングで1位を獲得しています。

Aqua Voiceは、Y Combinator出身のスタートアップ(Aqua Voice Inc.、米サンフランシスコ拠点)が開発したAI音声入力ツールです。「どこの会社が作っているの?」「海外のサービスで大丈夫?」と気になる方もいると思いますが、Y Combinatorはスタートアップの世界で最も権威ある投資プログラムの一つ。信頼性の面では十分な裏付けがあります。
最大の特徴は、独自開発のAIモデル「Avalon」です。OpenASRリーダーボード(音声認識の精度ランキング)でプロプライエタリモデル1位を獲得しており、業界トップクラスの精度を誇ります。
対応言語は49言語。もちろん日本語もしっかりカバーされています。
対応プラットフォーム
| プラットフォーム | 対応状況 |
|---|---|
| macOS | 対応済み |
| Windows | 対応済み(Windows 10以降) |
| iOS | 2026年3月リリース |
| Android | 2026年3月リリース |
2026年3月のiOS・Android対応が大きなアップデートでした。デスクトップ専用だったAqua Voiceが、スマホでも使えるようになっています。
料金プラン|無料枠と有料プランの違い
無料プランは体験用で、本格利用はPro(月$8)から。競合Wispr Flowの約半額で、1ヶ月無料で試せるプロモーションもあります。

プラン比較表
| プラン | 月額 | ワード数 | カスタム辞書 | 主な用途 |
|---|---|---|---|---|
| Starter(無料) | $0 | 1,000ワード(累計) | 5件 | お試し |
| Pro | $8(年払い)/ $10(月払い) | 無制限 | 800件 | 個人利用 |
| Team | $12/ユーザー | 無制限 | 800件 | チーム利用 |
無料プランでどこまで使えるか
Starterプランの累計1,000ワードは、実際にしゃべってみると約5〜10分で上限に達します。正直、日常使いするには足りません。
ただし「音声入力の精度ってこんなに違うのか」と実感するには十分な量です。まず無料で試して、精度に納得してからProに上げるのが最善のルートだと思います。
ちなみに、こちらのボタンからアカウントを作成すると、Proプランが1ヶ月無料で使えるクレジットがもらえます。無料枠の1,000ワードでは足りないと感じた方は、まずこのクレジットで1ヶ月しっかり試してみてください。
Proプランは月$8の価値があるか
僕は年払い(月あたり$8)で契約しています。月$8という金額に対して、タイピング時間の短縮だけでも十分に元が取れていると感じています。
あとで詳しく比較しますが、競合のWispr Flowは月額$15です。Aqua Voiceは年払いならほぼ半額で同等以上の精度が使える計算になります。
月払い($10)でも十分安いですが、続ける前提なら年払いのほうがお得です。僕は迷わず年払いにしました。
使い方ガイド|インストールから基本操作まで
インストールから利用開始まで数分で完了します。ファンクションキーを長押ししてしゃべるだけのシンプルな操作体系です。
インストールと初期設定
Aqua Voiceの導入はシンプルです。
- 公式サイトからアプリをダウンロード
- インストールしてアカウントを作成
- マイクのアクセスを許可
ただし、今ならこちらからアカウントを作成すれば、Proプランが1ヶ月無料で試せます。
設定が完了した時点で、もう使い始められます。
基本操作はファンクションキーを長押しするだけ
操作方法は驚くほどシンプルです。ファンクションキー(fn)を長押ししながらしゃべる。それだけで音声がテキストに変換されます。
キーを押している間だけ音声を拾う仕組みなので、ボタン式のトランシーバーに近い感覚ですね。
起動にかかる時間は50ミリ秒以下。テキストの挿入は450ミリ秒。キーを押した瞬間にもう使える状態になっていて、待たされるストレスがまったくありません。
個人的にこのUIはとても気に入っています。「ボタンを押しながらしゃべる」という物理的なアクションがあることで、画面に向かって独り言を言う感覚が薄れるのが大きい。音声入力に対する心理的なハードルが、他のツールより明らかに低いと感じています。
知っておきたい便利機能

Aqua Voiceは精度だけでなく、機能面もよく作り込まれています。
リアルタイムテキスト表示
しゃべりながらテキストがリアルタイムで表示される点が秀逸です。他の音声入力ツールだと、しゃべり終わってからテキストが出るものが多いのですが、Aqua Voiceはしゃべっている最中から文字が見える。認識が正しいかどうかをその場で確認できるので、安心感が段違いです。
フィラー自動除去
「えーと」「あのー」「うーん」といった言い淀みを自動で除去してくれます。しゃべるときにフィラーが入るのは自然なことですが、出力されるテキストはきれいに整形された文章になる。しゃべった内容をそのまま使えるケースが多いのはフィラー除去のおかげです。
Fluid Rewrites(音声によるテキスト編集)
しゃべった後に「もう少し短くして」「言い換えて」と声で指示すると、テキストを音声だけで編集できます。キーボードに手を伸ばさずに入力から編集まで完結できる機能です。
Client Context Engine
今どのアプリで入力しているかをAqua Voiceが認識して、文脈に合わせたフォーマットに自動調整してくれます。Slackならカジュアルな文体に、メールならフォーマルに。コードエディタなら変数名やコマンドとして認識してくれる場面もあります。
精度は本当にすごいのか?実体験と検証データ
Apple標準音声入力との精度差は17倍。同音異義語の判定力が別次元で、カスタム辞書を活用すればさらに精度を上げられます。
同音異義語の判定精度
僕がAqua Voiceを使っていて一番驚いたのが、同音異義語の判定精度です。
日本語は同音異義語が非常に多い言語です。「きかん」だけでも「期間」「機関」「気管」「帰還」と複数の候補があります。OS標準の音声入力だと、ここで意図しない変換をされてイライラすることが日常茶飯事でした。
Aqua Voiceは前後の文脈から適切な候補を選んでくれます。完璧ではありませんが、修正が必要になる頻度は体感で10分の1以下に減りました。
Apple標準音声入力との精度比較
iOS版のリリース時に行われた検証では、Apple標準の音声入力と比較して精度差17倍という結果が報告されています。
17倍という数字だけ見ると大げさに聞こえるかもしれませんが、僕の体感でも「別次元」という表現がしっくりきます。OS標準の音声入力に慣れている方がAqua Voiceを初めて使うと、精度の差に驚くはずです。
カスタム辞書と辞書登録で精度を上げる
Proプランではカスタム辞書に最大800件の単語を登録できます。
固有名詞、業界用語、略語、ツール名など、自分の仕事や発信で頻出する言葉を登録しておけば変換精度がさらに上がります。僕は「Claude Code」「NotebookLM」「Aqua Voice」など、一般的な辞書にはない固有名詞を中心に登録中です。
カスタム辞書の使い方は、設定画面から単語を追加するだけ。登録した瞬間から反映されるので、手間もかかりません。
競合比較|Wispr Flow・Superwhisperとの違い
精度とコスパならAqua Voice、コンプライアンス重視ならWispr Flow、オフライン必須ならSuperwhisper。用途に合わせて選ぶのが正解です。
音声入力ツールを検討するとき、候補に上がるのはAqua Voiceのほかに、Wispr FlowとSuperwhisperの2つです。

3社比較表
| 項目 | Aqua Voice | Wispr Flow | Superwhisper |
|---|---|---|---|
| 月額 | $8(年払い) | $15 | 買い切りプランあり |
| 精度 | 最高クラス(Avalon) | 高い | 中〜高 |
| リアルタイム表示 | あり | なし | なし |
| オフライン対応 | なし(クラウド処理) | なし(クラウド処理) | あり |
| セキュリティ | SOC 2 Type II / Privacy Mode | SOC2 Type II / HIPAA準拠 | オフライン処理可 |
| プラットフォーム | Mac / Win / iOS / Android | Mac / Win / iOS / Android | Mac のみ |
| 起動速度 | 50ms以下 | 非公開 | 非公開 |
用途別おすすめ
精度とコスパを重視するなら → Aqua Voice
Wispr Flowの約半額($8 vs $15)で同等以上の精度が使えます。リアルタイムテキスト表示もAqua Voiceだけの機能です。個人利用で音声入力ツールを選ぶなら、現時点でコスパ最強の選択肢だと思います。
エンタープライズ・コンプライアンス重視なら → Wispr Flow
SOC2 Type IIとHIPAAに準拠しているのはWispr Flowだけです。医療・金融など機密性の高い業界で使う場合や、会社のセキュリティポリシーが厳しい場合はWispr Flowが安心です。
プライバシー最優先・オフライン必須なら → Superwhisper
音声データをサーバーに送信したくない方にはSuperwhisperが向いています。オンデバイス処理なので、インターネット接続なしでも動作します。ただし対応プラットフォームがMacのみという制約があり、精度もAqua Voiceには及ばないと感じています。
僕がAqua Voiceを選んだ理由
判断基準はシンプルでした。精度が圧倒的に高くて、月$8のコスパは他に敵がない。プライバシーについても、SOC 2 Type II認証やPrivacy Modeが用意されているので、個人利用としては十分安心できます。僕はPrivacy ModeをONにした上で使っています。
AIとの対話で真価を発揮する活用法
ChatGPTやClaudeへのプロンプト入力を音声に変えるだけで、思考のスピードそのままでAIとやりとりできるようになります。

プロンプト入力が「口頭指示」に変わる
僕がAqua Voiceの恩恵を一番感じているのが、AIツールとの対話です。
ChatGPTやClaudeにプロンプトを打ち込む場面を想像してください。やりたいことは頭の中にあるのに、それをキーボードで打つ時間がもったいない。特に長い指示や、ニュアンスを伝えたいときほど、タイピングがボトルネックになります。
Aqua Voiceを使い始めてからは、AIへの指示が「タイピング」から「口頭指示」に変わりました。「調べておいて」「こっちの切り口でまとめて」「ちょっと違うな、もう少しカジュアルに」。思いついたそばから声で伝えられるので、思考のスピードそのままでAIとやりとりできます。
Claude Codeとの組み合わせ
僕は普段、Claude Code(AnthropicのCLIツール)を使って作業をしています。ターミナル上でAIに指示を出してコードを書いたり、ファイルを操作したりするツールです。
Claude Codeとの対話にAqua Voiceを組み合わせると、音声でコードの修正を指示したり、ファイル操作を依頼したりできます。「この関数の引数をこう変えて」「テストを実行して結果を教えて」という指示をしゃべるだけで出せるのは、想像以上に快適です。
音声入力ツールとAIコーディングツールの組み合わせは、まだあまり語られていない使い方ですが、生産性の面では大きな伸びしろがあると感じています。
気になるポイント|セキュリティと注意点
SOC 2 Type II認証やPrivacy Modeなどプライバシー保護は手厚い一方、Bluetoothマイクの制約や無料枠の少なさは知っておくべきポイントです。
良い面ばかり書いてきましたが、気になる点も正直に書いておきます。
プライバシー保護の仕組み

「クラウド処理=プライバシーが不安」と思うかもしれませんが、Aqua Voiceはプライバシー保護にかなり力を入れています。
まず、SOC 2 Type II認証を取得済みです。独立した第三者機関による監査をクリアしており、データの取り扱いに関して一定のセキュリティ基準を満たしていることが証明されています。
次に、Privacy Modeという機能があります。ONにすると「ゼロデータリテンション」、つまり音声認識の結果テキストがサーバーに一切保存されなくなります。Teamプランでは組織全体に一括適用も可能です。
さらに、利用規約にユーザーのデータをAIモデルの学習に使わないと明記されている点も見逃せません。OpenAIやAnthropicといった第三者にデータを提供しないことも名指しで制限しており、かなり踏み込んだ姿勢だと感じます。
通信はTLS / WSSで暗号化されており、音声データの送受信自体も保護されています。
ただし注意点として、Privacy Modeは「保存しない」制御であって「送信しない」制御ではありません。音声データは処理のために必ずクラウドサーバーに送信されます。「そもそもデータを外に出したくない」という場合は、オフライン処理が可能なSuperwhisperが選択肢になります。
Bluetoothマイクとの相性問題
AirPodsなどのBluetoothイヤホンを使っていると、精度が落ちることがあります。
原因はAqua Voiceではなく、Bluetoothの通話プロファイル(HFP)の構造的な制約です。Bluetooth経由の音声は帯域が狭くなるため、音声認識の精度に影響します。有線マイクや、MacBook内蔵マイクのほうが安定した認識精度が得られます。僕も実際に有線と無線で比較して確認済みです。
おすすめマイクについては、特別なものは不要です。MacBook内蔵マイクでも十分な精度が出ますし、有線イヤホンのマイクでも問題ありません。
無料プランの制限
Starterプランの累計1,000ワードは、本格的に使い始めたらすぐに上限に達します。音声入力を日常的に使うならProプラン(月$8〜)への加入は必須です。
ただし、無料枠で精度を体感してから課金を判断できるのは良心的な設計だと思います。
まとめ|音声入力ツールの選び方
用途別に最適なツールは異なります。迷ったらまずAqua Voiceの無料プランで精度を体感してみてください。
- 精度とコスパ重視 → Aqua Voice(月$8、精度最高クラス)
- コンプライアンス・法人利用 → Wispr Flow(SOC2/HIPAA準拠)
- プライバシー最優先 → Superwhisper(オフライン処理)
音声入力は、一度使いこなすと戻れなくなる類のツールです。まだ試したことがない方は、まずAqua Voiceで精度を体感してみてください。キーボードで打ち込んでいた時間が、思考に使える時間に変わります。
こちらのボタンからアカウントを作成すると、Proプランが1ヶ月無料で試せます。



