fumiLab

fumimakerが作ったもの、やったことについて書いていきます。

うわっ...私の音質、低すぎ...?

f:id:fumimaker:20211214234847p:plain

はじめに

本記事は研究室でLTで話した内容になります。スライドはこちらになります。

どうも.お久しぶりです.未踏プロジェクトの進捗がまずすぎて毎日実装をやっています。(未踏の話はまたどこかできますね。)

コロナによりオンライン化が進み,オンラインミーティングが一気に普及しましたね.これまでもYoutube LiveやTwich,ツイキャスなどオンライン配信が身近でありましたが,世間的にもより身近になった感じがあります.

さて,みなさんZoomやってますか?.たまにやばい音質の人いますよね.あなたの音は大丈夫でしょうか.自分の音がどう聞こえているのか,返しで自分の音を聞いたことのある人は実は少ないと思います.

本記事では音に関する基礎知識から集音設計・機材選定の話をします.オンラインミーティングに限らずYouTube Live配信やZoomウェビナーなど今後様々なところで活きます.音で差をつけろ!

音にこだわる理由

"Good Sound, Good Research"という研究では,ビデオ会議の高品質な音質は相手に賢そうな印象を与えることができるとされています[1].この研究ではビデオ会議における音声品質が相手にどのような影響を及ぼすかを調査しており,音質が低かった場合,研究内容に対する理解が低くなったとされています[1].

f:id:fumimaker:20211214233921j:plain
Figure1. [1]より引用
あまり賢くない自分にとっては研究発表で賢そうな印象を与えられるかどうかは重要な問題です.

音質が良いとはなんだろう

どんなマイクを使えばいいのかしら?とよく聞かれます。しかし使う環境,シチュエーションによって異なり,どのような手段で集音するかなど適切に選定する必要があります.例に応じて見ていきましょう.

高音質とは?

耳を澄ましてください。何が聞こえますか? f:id:fumimaker:20211214234019p:plain

キーボードを叩く音、換気扇の音、エアコンの音、暖房の音、PCファンの音・・・。様々なことでノイズが出ています。これを背景雑音なんて呼んだりしますが、これは音質に大きく関わってくる重要な要素です。高音質とはなんでしょうか?私個人的には必要な音以外がない状態と考えています。オンラインミーティングの時、ノイズが多い環境ではなんとかこれを減らしていくことが高音質化の第一歩だと考えます。

しかし、どうしてもノイズをへらすことに限界はあります。研究室や会社だと周りの人のタイピング音や話し声などなどどうしても消せない音はあります。そこでノイズキャンセリングという技術がしばしば使われます。

TIPS

「高音質」は場合によって変わります。原音に忠実な音が高音質なのか、聞き取りやすい音なのか、ノイズが少ない音なのか、場合によって変わります。楽器演奏するときは原音に忠実なほうがよいでしょうし、オンラインミーティングのときは言葉が聞き取りやすい音がもともとの声よりも良いのかもしれません。

ノイズキャンセリング

ノイズキャンセリングとは、声と思われる周波数以外をフィルタリングして減衰させる技術のことです。明らかに声ではないタイピング音や空調の音などはごっそりカットして声らしき周波数だけを通すような仕組みになっています。これにより声としては聞きやすい(届きやすい)音になります。しかし、相手に届けられる帯域がガッツリ下がるので音質も下がりがちです。

しかしながら、ノイズキャンセリングなしには、背景雑音がすごすぎてなにを言っているのか聞き取れない人や、背景雑音音量が大きくとずっと喋りっぱなし扱いになってしまい会議を妨害してしまう人もいます。ノイズを相手に届けてしまうくらいなら周波数を絞って(音質を下げて)しまうというのが基本的な考えとなります。

逆に言うとノイズが全然ない人はノイズキャンセリングする必要は少ないとも言えます。

ノイズキャンセリングは音質が低下しがちだが必要不可欠な機能。

TIPS

人間の声は単一の周波数だけで鳴っているわけではありません。基本となる周波数の2倍波、3倍波などいわゆる倍音が鳴ったりいろいろな周波数に音が微妙に散らばることで声色やその人の声の特徴がでています。なので音の周波数が広く届けられることは高音質化に繋がります。よくハイレゾとか言っている人がいますが、あれもサンプリングしている周波数を広くとることで高音質化を狙っているものになります。(実際はもっと色々技術がありますがまたこんど)

マイク小噺: マイクの基礎知識

よく聞くダイナミックマイクコンデンサマイク。それぞれどう違うのか?

ダイナミックマイク

  • 多少安価・電源が不要・壊にくい(とされている)
  • 高い音圧に耐えられる
  • ほしい音を取りやすい
  • ハウリングしにくい
  • 現状の環境でいい音を取りたい人向け
  • ボイス・会議・語り向け

f:id:fumimaker:20211214234847p:plain
ダイナミックマイク SM58

オンラインミーティングを考えている人は多分これで良いです。とりあえずの環境でいい音・声を撮りたい人向けです。雑に使えてよく取れるので個人的にはこっちが使い勝手は良いと思います。

コンデンサマイク

  • 多少高価・ファンタム電源が必要
  • より感度が高いとされている
  • 環境音など細かい音をよく拾う
  • きちんと環境をチューンできる人向け
  • 楽器演奏・歌・ASMR・環境音収録向け
  • ちょっとかっこいい

f:id:fumimaker:20211214235002p:plain
コンデンサマイク(AKG)

しっかり環境を整えて(ローノイズ電源・吸音材防音室・高性能なオーディオIFなど)収録をする人向けです。ダイナミックマイクより環境音やASMRなど細かい音を取りたい人はこっちがいいと思います。本当に僅かな音でも乗るのでちゃんとした環境じゃないと逆にノイズが多い音が取れてしまいクオリティが下がりますが、ちゃんとした環境であればめちゃくちゃ空気感がある良い音が取れます。こだわりがある人向けです。

あと形がちょっとかっこいいですよね。プロが使ってるイメージあります。部屋においたらかっこいいからほしい。(オブジェ)

指向性

指向性は重要な要素です。指向性を制するものはマイクを制するといっても良い。実はマイクには音を取れる方向というのが決まっており、ここに合わなければ音がほとんど入りません。

無指向性

f:id:fumimaker:20211214235030p:plain
無指向性
指向性がないタイプです。360度どこからでも音を取ります。大人数での会議などでは有利に働きますが、多くの場合では背景雑音が乗りまくって使いづらいです。MacBookや多くのラップトップの内蔵マイク、Bluetoothイヤホンなど多くのデバイスではこちらが使われています。

単一指向性

f:id:fumimaker:20211214235039p:plain
単一指向性
指向性があるタイプです。主に前方の音を取るものになります。皆さんにはこれを強くおすすめしたい。これを使うだけで多くの背景雑音を排除することができます。物理的にマイクの前方以外の音を取れないので喋っている人の声が多く届くようになります。雑音が多い環境でもノイズキャンセリングを弱くすることが可能です。

この種類ではショットガンマイクなど超単一指向性みたいなのもありますが普通は使う機会がないと思います。

その他の種類

f:id:fumimaker:20211214235104p:plain

www.ikebe-gakki.com www.audio-technica.co.jp

マイキングについて

f:id:fumimaker:20211214235142p:plain

マイキングってなんだ?my kingではなくmicingです。よくイラストのようにマイクを持っている人がいますが、マイクは先程の通りほとんどが単一指向性です。なので音が入る場所に向かって垂直に音を入れるのが最も効率的に音を入れる方法となります。イラストのようにマイクに向かって喋っても音は効率よく入らず天井からの反響音も入ってしまいます。(詳しくないので知らないのですがこの向きでも入るマイクってあるんですかね?) カラオケのときも同様なのでマイクの向きに注意して音を入れてみてください。

コンデンサマイクではこの内部の丸いところに向かって垂直に入れるのがより良い音の入れかたです。

f:id:fumimaker:20211214235203p:plain
音の入れ方

事例

ここまではマイクやその周辺の基礎知識について簡単に紹介しましたが、ここからは事例ごとの例を考えてみます。

オンラインミーティング@研究室・会社

ポイント

マイク

f:id:fumimaker:20211214235244p:plain

会社や研究室では雑音が多い環境が想定されます。きれいに音を入れる一番のコツは口をマイクの距離を近くしてたくさん音を入れるようにすることです。たくさん音が入れば相対的に雑音レベルが小さくなるのでノイズキャンセルも弱くすることができます。口との距離を近くするにはピンマイクやヘッドセット(有線)、指向性のあるダイナミックマイクがおすすめです。職場にマイクアームを設置するのは流石に場所を取るのでピンマイクやヘッドセットが気軽に音を入れやすいかなと思います。ヘッドセットはマイクを口の前に持ってきやすくて良いですね。しかし、後述する理由により有線のものをおすすめします。 ピンマイクなど有線マイクのアナログ信号を直接PCをに入れるときはTRRSやTRS配列に注意しましょう。指しても聞こえません。

ピンマイク

この辺は使っみてよかったです。ただし、3極(TRS)なのでiPhoneMacBookなどの4極(TRSS)に挿しても聞こえません。変換ケーブルを使いましょう。

変換はこんなの。なんでもいいと思います。

自分がzoomで試した中では、中もしくは自動にするといい感じに背景雑音を消してくれました。自動は結構優秀で割と適した強さに調整してくれます。

f:id:fumimaker:20211214235255p:plain
Zoomの設定
一番重要なのは声を張ってしゃべることです。雑音が多い状況ではこれに勝る方法はありません。はっきり大きく喋りましょう。

オンラインミーティング@自宅・静かな場所

ポイント

マイク

f:id:fumimaker:20211217220351p:plain
ダイナミックマイクコンデンサマイクの例

静かな環境ではノイズキャンセリングを弱くできるので広い周波数帯の音を入れることができます。また少しマイクを遠ざけてもノイズが少ないので大丈夫そうです。しかし、やっぱり近いほうが音は良く入るので近いに越したことはないです。また、コンデンサマイクも活用できます。細かな音も入れることができるようになります。ただし、Zoom側で多少ノイズキャンセルが入るので環境音をそのまま入れるのは厳しいかもしれません。

Zoomにはオリジナオーディオというオプションがあり、ノイズキャンセリングなしで音を入れることができるものがあります。これは本当に何もフィルタが無いのでエアコンや空気清浄機の音が余裕で入ります。楽器演奏などは良いかもしれませんが普通のミーティングでは使わないほうが良いでしょう。

f:id:fumimaker:20211214235528p:plain
zoom設定

King gnuも近くで歌ってますね。

f:id:fumimaker:20211214235614p:plain
King gnuも近そう

平井堅もマイク食べそうになってます。

f:id:fumimaker:20211215003452p:plain
マイク食べそう

マイクはダイナミックマイクコンデンサマイクがありますが、記事の下の方で組み合わせ例を取り上げています。 とりあえずみんな大好きSM58。王道です。

コンデンサマイクではAT2020が売れてるみたいです。

高いですがいいやつがほしい人はAKGのC214とか。

オンラインミーティング(複数人)

ポイント

  • Zoomノイズキャンセリングは弱もしくはOFF (オリジナルオーディオを有効にするのもあり)
  • やっぱりできるだけ近くで集音する
  • しゃべる人はマイクに向かってしゃべる

マイク

  • スピーカーフォン
  • (全指向性マイク)

f:id:fumimaker:20211214235644p:plain
スピーカーフォン

オンラインとオフラインのハイブリッドでやりたいこともあるでしょう。そういったときは全指向性のマイクを使うのが良いとされています。しかし、扱いが非常に難しいです。そこでおすすめなのがスピーカーフォンという代物です。

スピーカーフォンは音の出力とマイクがワンセットになったデバイスです。デバイス上でノイズキャンセリングや指向性をアダプティブに操作してくれます。とても賢い。会議室で色々なところに座っている人の声をデバイスに内蔵された複数のマイクでとって音速の差から方向を識別して集音してくれます。バイスが狙って指向性をつけてくれるような感じでとてもおもしろいです。

Yamaha製のものは高価ですが、会議室1つで集音したいならぜひおすすめしたいです。集音力が半端ない。仕事でやっている方は高くても強く推奨します。

Anker製やYamahaからも小型のものも出ています。使っていますが、大きめなテーブルに座って3-4人でやるくらいなら使える集音力です。個人ユースに最適です。

バイス上でノイズキャンセリングされるのでやはり音質という面ではだいぶ周波数が絞られて出力されますので劣化します。(これはしかたない) Zoom上ではノイズキャンセリングがありますが、そうすると二重でノイズキャンセリングすることになり、好ましくないです。Zoomではノイズキャンセリングを弱もしくはOff(オリジナルオーディオ)にしましょう。デバイスが十分強いノイズキャンセリングをしてくれているので大丈夫です。

個人的に使ってみた感じではやっぱり音が少しモゴモゴするので一人で使うのは微妙かも。あとマイクに向かって喋らないと入りにくいので注意です。(デバイスは音が入ってきた方向で識別していますので回り込みは消されます) 大人数でやるなら必需品かなと思います。

f:id:fumimaker:20211214235659p:plain
Zoom設定

無線イヤホンTIPS

AirPodsなど無線Bluetoothイヤホン便利ですよね。マイクもついているのでこれでミーティングに参加することもできます。しかし、Bluetoothでマイクとイヤホンを同時に使おうとするとハンズフリープロファイルで接続されます。HSPとも言いますが、これが厄介です。なんと、AM放送並の音声帯域(8KHz)しか持っておらずこれは電話くらいの品質です。 なのでこれを使ってミーティングに参加するのはおすすめできません。

(Bluetoothはそもそもそんなに帯域がたくさん取れる規格ではないのでリアルタイム性を確保するには仕方ないかなとも思います。)

HSP1.6からHD Voiceという規格が策定されました。これはFM放送くらいの帯域(16KHz)があり、テープレコーダーくらいの品質です。しかしながら、このHD Voiceに対応したデバイスとレシーバーの相性、ドライバ問題、OS相性などがあり結構厳しいものがあります。(使えるはずなのに使えない、じつは動いてなかったとかあります) AirPods Pro + MacBookなどの組み合わせでは何もしなくてもHD Voiceで接続されているようです。聞いた感じ、16KHzくらいの音はあったと思います・・・。

無線イヤホン全般そうですが、指向性がないので背景雑音が入りまくります。結果としてノイズキャンセリングがきつくなり音質が低下する、ということにも繋がります。雑な会議やリラックスしててもOKなら全然これでも良いかもしれませんが、面接やいざというときには考えたほうがいいかもしれないですね。

MacBook + AirPods

余談ですが、MacBook + AirPodsであれば

とするのが個人的に良いと思っています。なぜか知りませんがMacBookのマイク品質は異常に良く、全域に渡りよく拾います。無指向性のコンデンサマイクなのでタイピング音やファンの音が入ってしまうのが欠点ですが、うまく使えばかなり良いかもしれません。

ここまで音質に拘ってきたが・・・

実はZoom、めちゃくちゃ周波数を削ってきます。実際に送信されている音を聞いてみると残念な気持ちになることも多々。しかも相手のネットワーク環境で大きく変わってきます。しかし、これまでにあげてきたようなこだわりはそれでも意外と分かるものです。個人的な感想ですが、聞き取りやすく、長時間聞いていてもストレスがないなと思っています。

また、Zoomではだいぶ削られますが、DiscordやYouTube Liveなどでは高品質な音声に直結してきます。やるやらないは全然違う(と個人的には思っています)。例えばYouTube Liveでは44kHz@128kbps(2ch)で配信できますし、Discordでは課金すると328kbps!!で配信できます。すげー。

ゲーム実況、番組配信、弾き語り、朗読、ASMRなどは特に集音設計や機材選定が音質に直結するので参考にしてみてください。

マイクに音を入力するまでの4Step

f:id:fumimaker:20211214235943p:plain
4Step

  1. マイクで集音
  2. ミキサー、エフェクターで音をミックス
  3. オーディオインターフェイスなどで符号化
  4. PCに入力しアプリケーションで利用

これらの手順を経てPCに音が入ります。とは言っても個人でどれ用意すればいいのかわからん!と思うので個人的にどれが良さそうか考えてみます。オーディオに関してはそれだけで趣味になるくらいの世界なのでここから先は詳しい人は飛ばしてもいいかもです。

マイク

あんまり詳しくないので教えて下さい。

Sure SM58

通称ゴッパーというやつ。安いし良いです。もう全部あいつ一人でいいんじゃないかな。っていうマイクです。だいたいみんなが見たことがあるマイクはこれです。1万程度です。平素よりお世話になっております。

Audio-technica AT2020

Amazonで評判らしい。個人ユースには良いのではないでしょうか。あとかっこいい。これも持っています。コンデンサマイクはファンタム電源という+48V程度の電源が必要なので注意しましょう。ファンタム電源供給可能なミキサー、オーディオインターフェイスか確認が必要です。

AKG C214

ちょっと高いけどいいやつがほしい人はこれ。これで困る人あんまりいないと思います。

TIPS マイクのIF

マイクのIFには大きく分けて2つあります。

  • アナログ接続
  • USB接続

アナログ接続

f:id:fumimaker:20211215002709p:plain
XLR端子
マイクです。一般的にはXLR端子(キャノン端子)でミキサやオーディオインターフェイスに接続します。これが普通です。アナログ出力なのでPCに接続するにはオーディオインターフェイスが必要です。

USB接続

こういうの。

マイク自体にインターフェイスが入っており、PCにそのまま挿せるUSBが出ています。マイク自体でミュートしたり、ゲイン調整したりできるので便利です。手軽でコンパクトですが、マイク内ですべて完結しているので、あとで音を大きくしたい、エコーを掛けたい、エフェクトをかけたいなどはすることができません。また、マイクの作りによってはホワイトノイズが乗ることがあります。

ミキサー兼オーディオインターフェイス

複数の音をミックス(調整)するのでミキサーと呼ばれています。エコーなどエフェクトをかけたり、周波数をいじったりできます。また、フェーダーで音量調整ができて便利です。普通はオーディオインターフェイスと別ですが一緒になってるやつもある。一緒のほうが安いですが、IFの品質が低いとされています(僕にはわかりませんでした)

Behringer Q1204USB

みんな大好きベリンガー。安くてフェーダーついてて多チャンネル。しかもIF付き。これが2万ってびっくりですね。ただし、結構場所を取るので自宅の場合は場所に注意です。フェーダーが必要か、8chも12chも必要かはよく考えてください。

小さいやつ

これは小さいやつです。こっちのほうがコンパクトでいいかもしれません。

もっといいやつ

デジタルミキサーというやつです。配信用に特化しておりオーディオIFはもちろん、効果音入れるやつとか色々あります。仕事でやるならほしい。

オーディオインターフェイス

これはオーディオインターフェイス単体です。アナログの音をPCに入力結構するための変換機的なものです。ミキサーにオーディオインターフェイスがついている場合は必要ないです。

サンプリング周波数やビットレートが高かったり、電源が高品質だったりするので高いですね。でも品質はたしかです。

みんな大好きベリンガーもある。

マイクアーム

あると便利。自宅ならあっても良いかもしれません。ダイナミックマイクはこんなかんじ

f:id:fumimaker:20211215002939p:plain
ダイナミックマイクの場合[4]より引用

コンデンサマイクはこんな感じに設置します。

f:id:fumimaker:20211215002847p:plain
コンデンサマイク[3]より引用

ポップガードがあると良いです。

まとめ

オンラインが増えた現代、一般人も配信環境があると良いです。

  • マイクの指向性を扱おう
  • ノイズが多い環境ではマイクと近づこう
  • 高品質サウンドで差をつけろ!

アドベントカレンダーに間に合わせるためにくっそ急いで書いたのでtyopしてたらすみません。あと、オーディオはめちゃ初心者なので間違ってたら教えて下さい。 そんなところです。

参考文献

[1]Newman, Eryn J., and Norbert Schwarz. “Good Sound, Good Research: How Audio Quality Influences Perceptions of the Research and Researcher.” Science Communication, vol. 40, no. 2, SAGE Publications, 2018, pp. 246–57, https://doi.org/10.1177/1075547018759345.

[2] マイクロホンを識る|マイクロホンナビ|マイクロホン|オーディオテクニカ https://www.audio-technica.co.jp/microphone/navi/whatis/02.html

[3] 激安のEarambleマイクスタンド(デスクアーム)を購入したら思った以上に捗った! | トコログ https://tokolog.net/archives/2398

[4]マイクアームは長いものを選べ!ゲーム配信やzoom会議、youtubeの動画制作に活用できるマイクアームを実際に使ってレビュー【CLASSIC PRO/CDA10B】 | きちデン! https://kichiden.net/classicpro-cda10b/