文章を書く仕事をしていると、ふと気づく瞬間があります。
「今日、1日中キーボードを叩いていたな」と。
肩はバキバキ、手首は重たい。なのに書けた文字数は、体感ほど多くない。僕もずっとそうでした。

この状況を変えてくれたのが、音声入力です。しかも特別なソフトは不要で、MacにもWindowsにも標準搭載されています。
ただし、ショートカットを設定しないと一生使い物になりません。逆に言えば、ショートカットさえ押さえれば、その日から生産性は確実に変わります。
この記事では、WindowsとMacそれぞれの音声入力ショートカット設定を具体的に解説します。あわせて「なぜ音声入力を今すぐ始めるべきか」のデータも置いておきます。
結論:音声入力はタイピングの約3倍速。今すぐ始めるべき
先に結論をまとめます。
- Windows:Win + H で即起動(設定不要)
- Mac:システム設定から「どちらかのコマンドキーを2回押す」を選ぶのがおすすめ
- 速度:音声入力はタイピングの約3倍(スタンフォード大/百度Deep Speech 2)
- 精度:主要各社のAI音声認識で90〜95%前後
つまり、設定に5分かければ、あとは毎日3倍の速度で文章が書けるわけです。やらない理由がない、というのが僕の立場です。

Windowsの音声入力ショートカット:Win + H で即起動
Windowsは非常にシンプルです。
Windowsキー + H を押すだけで、音声入力が起動します。特別な設定は不要で、初期状態のまま使えます。
使い方の流れ
- 文字を入力したい場所(Word、ブラウザのテキストボックスなど)にカーソルを置く
- Win + H を押す
- マイクアイコンと「Listening」の表示が出たら、そのまま話す


Windowsの音声入力には、話した内容に自動で句読点を打ってくれる機能があります。起動中に表示される音声入力ツールバーの歯車アイコンから、オン/オフを切り替えられます。最初はオンのままで問題ありません。
Macの音声入力ショートカット:コマンドキー2回押しがおすすめ
Macは少しだけ設定が必要です。ただし一度やれば終わりなので、面倒がらずに済ませてしまいましょう。
設定の手順
- システム設定 → キーボード → 音声入力 を開く
- 音声入力を「オン」にする
- 「ショートカット」のプルダウンから好きなキー設定を選ぶ

言語とマイクの入力元はデフォルト設定のままで問題ありません。
そして重要なのがショートカットの割り当て。5種類の設定+カスタム設定が選択できます。

プルダウンに並ぶ選択肢は以下の通りです。
- コントロールキーを2回押す
- ファンクションキーを2回押す
- 右のコマンドキーを2回押す
- 左のコマンドキーを2回押す
- どちらかのコマンドキーを2回押す
- カスタム設定(好きなキーを選択する)
おすすめは「どちらかのコマンドキーを2回押す」
僕のおすすめは、「どちらかのコマンドキーを2回押す」です。
理由はシンプルで、コマンドキーはキーボードの両端にあるため、その時に空いている方の手で押せるから。片手がマウス、もう片手がキーボード上——という状態でも、どちらかのコマンドキーは必ず空いています。
コントロールキーだと小指で押す位置にあり、手首にやや無理がかかります。ファンクションキーも左手限定になりがちです。
両手のどちらでもトリガーできる、という柔軟性が、音声入力を「気軽に起動する習慣」につなげてくれます。

Macのショートカットを変更したい場合
すでに設定済みで「別のキーにしたい」という場合も、同じ システム設定 → キーボード → 音声入力 → ショートカット から変更できます。プルダウンを切り替えるだけで即時反映されます。
他のソフトのショートカットと競合している時は、「カスタム設定」から好きなキーに割り当ててしまうのが早いです。
音声入力を使いこなすコツ【Mac/Windows共通】
ショートカット設定が済んだら、あとは話し方を少し工夫するだけで認識精度がグッと上がります。僕が最初にハマった失敗から学んだポイントを3つ挙げておきます。
- マイクは口から20〜30cmの位置をキープする:はじめは近すぎて「ス〜」という息のノイズばかり拾われて、全然認識してくれませんでした
- 早口にしない:焦って早口になると、一気に精度が落ちます。ニュースキャスターくらいのテンポが、僕にとっては一番安定しました
- 固有名詞は後から直す前提で進める:人名や商品名は誤認識されがちなので、途中で止めず、話し切ってから一括修正した方が結果的に速いです
特に3つめは、最初のうちは「今の聞き取れたかな?」と確認したくなるのですが、グッと我慢して話し切る方が効率的です。
タイピングを続けると、地味に体が壊れていく

速度や精度の話もありますが、僕が音声入力を推す一番の理由は、体への負担です。
タイピングは指先だけの単純運動だと思われがちですが、実際は前腕・僧帽筋・胸鎖乳突筋が常時緊張し、背骨は前傾で固定されます。
これが毎日8時間。
巻き肩やストレートネックが慢性化すると、呼吸は浅くなり、集中力も落ちていきます。僕自身、整体に駆け込んだ回数を思い出すと、なかなか笑えません。
音声入力を使う時間が増えると、姿勢を崩したまま作業する時間そのものが減ります。体を守るためのツール、という側面があるわけです。
音声入力の精度は本当に高いのか|主要各社のデータ
「音声入力って、昔使ったけど変換がひどかった」という記憶を持つ人は多いと思います。
僕も昔はそうでした。ただ、ここ数年で状況は完全に変わっています。各社が公表している数値を並べてみます。
各社の音声認識精度
音声入力機能の精度はここ数年で劇的に向上しており、充分実務で使えるレベルに達しています。単語認識率は90〜95%前後。誤変換の修正に費やす手間よりも、打鍵時間の短縮メリットが勝る段階に到達しています。
| 2017年のMary Meeker「Internet Trends」 | “human language 95 % accuracy”を達成と報告 | |
| Microsoft | 2017年Switchboard評価 | WER 5.1 %(正解率94.9 %)と公式ブログで公表 |
| Apple | 2024年Apple Machine Learning論文 | 平均WER 9.2 %(正解率90.8 %)を提示 |
2017年時点ですでに人間並み。そこから各社さらに磨きをかけています。
タイピングとの速度比較

実験データでは、音声入力は平均タイピング速度(日本語で1分あたり約300文字)を軽々と上回り、同条件で900文字/分を超えた事例もあります。単純計算で入力速度は約3倍、1時間の執筆で原稿2本分の差が生まれます。
| スタンフォード大/百度Deep Speech 2実験 | 英語 153 WPM vs キーボード 52 WPM(2.93倍)、中国語も2.87倍 |
| AI系メディアAIZINE記事 | 人は 1分300文字発話、タイピングは 150〜200文字/分(職場平均調査も同レンジ)。話速×3 分=900文字の計算例を同記事が記載 |
精度も速度も、もう十分実用圏内というわけです。
まずは標準機能で十分。精度をさらに求めるならAqua Voice
ここまで紹介したWindowsとMacの音声入力は、どちらもOSに標準搭載されている機能です。追加料金もインストールも不要で、設定さえ済ませれば今すぐ使えます。
最初の1ヶ月は、標準機能だけで十分だと思います。習慣化さえできれば、それだけで生産性はかなり変わります。
そのうえで、「もう一段階、精度とスピードを上げたい」と感じたタイミングで、AI音声入力ツールを検討するのがおすすめです。
僕自身、今のメインは Aqua Voice に乗り換えています。句読点や改行を文脈から自動で補正してくれて、OS標準とはまったく別物の使い心地です。半年使い込んだ感想と他ツールとの比較を別記事にまとめているので、興味があればどうぞ。
まとめ
最後にもう一度、要点を置いておきます。
- Windowsは Win + H。設定不要で今すぐ使える
- Macは システム設定 → キーボード → 音声入力 から「どちらかのコマンドキーを2回押す」
- 速度はタイピングの約3倍、精度は90〜95%
- 体への負担も減る
- 標準機能で習慣化 → 物足りなければAqua Voiceへ
音声入力を習慣化しよう
音声入力の生命線は、習慣化です。初週は「ブログの見出しだけ声で入れる」「メールの3行だけ音声で下書きする」くらいの小さな成功体験で十分でした。
続けていれば、ある日ふと気づきます。
「あれ、今日ほとんどキーボード触ってないな」と。
そうなれば、もう元には戻れません。
