メニュー English Ukrainian ロシア語 ホーム

愛好家や専門家向けの無料テクニカル ライブラリ 無料のテクニカルライブラリ


無線電子工学および電気工学の百科事典
無料のライブラリ / 無線電子および電気機器のスキーム

デジタル携帯通信システムにおける音声コーディング。 無線エレクトロニクスと電気工学の百科事典

無料のテクニカルライブラリ

無線電子工学と電気工学の百科事典 / モバイル通信

記事へのコメント 記事へのコメント

この記事は、電気通信におけるデジタル音声コーディングの一般原則を思い出させます。 著者は、デジタルセルラー通信システムで使用される非常に複雑なコーディングプロセスを十分に詳細にカバーしています。 理論的研究と独自のエンジニアリング ソリューションにより、エレガントな小型加入者無線電話機の作成が可能になりました。 そこで行われている複雑なプロセスは、ユーザーや多くの電気通信専門家さえ知りませんが、読者はこの記事から学ぶことができます。

音声信号の謎は、電気通信が出現するずっと前から研究者の注目を集めていました。 1707世紀に遡ると、サンクトペテルブルクの学者で最も偉大な数学者の一人であるレオンハルト・オイラー(1783~16年)は、1761年XNUMX月XNUMX日付のドイツ王女に宛てた手紙の中で次のように書いている。「我々の演説の音声をあらゆる変更を加えて発することができる機械の構築は、間違いなく最も重要な発明となるだろう……そのような機械の追加は私には不可能ではないようだ。」

トーキングマシンを発明するというアイデアは多くのクリエイターの心を刺激し、オイラーが想像した形でそれを作成するだけでなく、遠くに音声を伝える手段としてもそれを作成しようとしました。 たとえば、電話の発明者である A. G. Bell (1847-1922) は、そのような機械の設計に携わっていました。 しかし、最終的には、そのような機械がなくても、遠隔地への音声伝送は可能であることが判明した。 これは非常に簡単に達成されました。 マイクを使用して音声を伝える空気振動を電流振動に変換し、電線を介して送信し、受信側で電話を使用して再び空気振動に変換します。

この伝達方法は、音を伝える空気振動と音を伝える電気振動との明らかな類似性からアナログと呼ばれます。 振幅変調によるアナログ音声伝送の研究では、通常の音声再生品質には 300 ~ 3400 Hz の周波数帯域で十分であることが示されています。 このような帯域は国際標準として採用され、それに基づいて世界規模の電話網が構築されました。 今日のこのネットワークの動作原理は、すべての信号員だけでなく一般の人々にもよく知られています。

有線通信ネットワークにおけるデジタル音声伝送

通信手段がデジタル技術に移行したとき、電話通信の組織化へのアプローチに根本的な変化が生じました。 デジタル伝送方式の利点は広く知られています。 その中で最も重要なことだけを思い出してみましょう。デジタル技術により、あらかじめ定められたあらゆる品質のコミュニケーションを提供できるようになります。 デジタル音声伝送の場合、音声信号のアナログからデジタルへの変換を実行する必要があります。つまり、アナログ信号にサンプリング、量子化、コーディングを施します。 これらの演算の組み合わせは、パルス符号変調 (PCM) と呼ばれます。 コテルニコフの定理に従って音声信号の形状を正確に記述するには、音声信号を 8 kHz の周波数でサンプリングする (つまり、125 μs ごとにサンプルを取得する) 必要があり、通常の音声再生品質を得るには、各サンプルを 8192 レベルに分割されたスケールで量子化する必要があります (均一な量子化スケールを選択する場合)。 各サンプル値を 13 進数としてエンコードするには XNUMX ビットが必要です。

その結果、一連のバイナリ パルスを使用して電話での会話を送信するには、8x13 = 104 kbps の速度が必要になります (これは、最適なコーディングでは 52 kHz の周波数帯域に相当します)。 この数字をアナログ伝送に必要な 3100 Hz の帯域幅と比較すると、デジタル伝送の利点を犠牲にして必要な帯域幅が大幅に増加していることに驚かざるを得ません。 デジタル伝送システムを実装する場合、伝送速度を下げようとするのは当然のことです。

この方向への最初のステップは非常に明白です。 アナログ音声信号のレベルは 213 dB の範囲で変化する可能性があるため、60 レベルへの量子化が必要です。 この場合、均一な量子化スケールを持つ高レベル信号は、低レベル信号と同じステップで量子化されます。 しかし、人間の聴覚器官による信号の知覚は信号レベルの対数に​​比例するため、高レベルの信号をより大まかに量子化し、低レベルの信号をより正確に量子化するのが自然です。 対数法則を使用した非線形量子化を適用することにより、ほぼ同じ伝送品質を維持しながら、サンプルあたり 64 ビットを省略できます。 その結果、ビットレートは711kbpsになります。 最も広く使用されているのはこの速度であり、CCITT 勧告 C.XNUMX で固定されており、多くの国で PCM 機器がこの速度で動作します。

速度をさらに下げることはできますか?

アナログ信号には多くの冗長性があります。 これにより、次のサンプルを予測し、各サンプルの実際の値と予測値の差のみを送信できます。 適切な予測スキームが適用される場合、信号増分の振幅の変化は信号自体の振幅の変化よりも小さくなり、送信される情報量の減少につながります。 この原理は、差動 PCM (DPCM) および適応差動 PCM (ADPCM) の構築に使用されており、トランシーバー装置のさらなる複雑化により、音声速度を 32 kbit/s 以下に下げることが可能になります。 装置の複雑化を続ければ、音声速度を 100 ~ 300 bps まで高めることが可能になります。 たとえば、送信側が音声からテキストへのコンバーター、受信側が読み取り機であると想像できます。

音声伝送の速度をさらに低下させる既知の方法がありますが、これについては詳しく説明しません。 実際のところ、64 kbit / sの速度でデジタル音声を伝送するための装置は、一対のツイストを備えた最も単純な対称ケーブルを使用すると効率的であることが判明したため、誰もが満足しました。 IKM-30 装置は、都市電話交換機間の接続回線を圧縮することから凱旋行進を開始しました。 以前は、30 つの会話のみを送信するためにケーブル ペアを介して接続回線を構成することが可能でしたが、IKM-30 装置では、同じペアを介して XNUMX の会話を送信することが可能になりました。 マルチチャンネル通信用のアナログ機器の助けを借りて、そのようなペアを最大限に活用することは問題外でした。

その後、IKM-120 装置や同軸ケーブルや光ファイバーを使用した高性能システムが登場し、有線通信ネットワークにおける音声信号の伝送速度を 64 kbps 未満に低下させるという深刻な問題は実質的に解消されました。 ADPCM 原理に基づいて多くの国で実施された 32 kbps の速度のデジタル伝送装置の数多くの開発(M. U. Polyak の指導の下で我が国で行われた開発を含む)でさえ、広く使用されていません。 有線通信におけるチャネル形成装置の帯域幅の増加と端末装置の複雑さの間のバランスは、まだ最初の解決策に傾いていません。

デジタルセルラー無線システムにおける音声符号化

携帯デジタル無線電話システムが開発され始めた 1980 年代後半から 1990 年代初頭にかけて、まったく異なる視点が開かれました。 新しい回線を敷設する、つまり帯域幅リソースを更新することで帯域幅を拡張できる有線ネットワークとは異なり、無線ネットワークには厳格な気密の法則があり、更新不可能な無線周波数リソースに対処する必要があります。 確かに、セルラー通信の考え方は、正確には、干渉する無線局からの同じ周波数の信号が届かない領域で送信周波数を繰り返すことによって、無線周波数リソースを更新することです。 しかし、ここでもそのようなリソースの更新の可能性は限られているため、伝送速度を下げるために機器をさらに複雑にすることは正当化されることがわかります。

たとえば、ほとんどのヨーロッパ諸国で採用されている GSM デジタルセルラー通信システムでは、標準音声速度は 13 kbps と 6,5 kbps です。 このような送信システムを実装するには、オイラーマシンの古い考えに目を向け、音声生成のメカニズムをより深く浸透させる必要がありました。

知られているように、現代の情報伝送理論の最も重要な成果の XNUMX つは、ソース コーディングとチャネル コーディングのタスクを分離するという推奨事項です。 情報源をエンコードするタスクには、送信メッセージを最も経済的な形式で記述すること、つまりメッセージ内の冗長性を削除することが含まれます。 このようにして受信された圧縮メッセージは干渉を受けやすくなり、送信中に破損する可能性があります。 したがって、ソース エンコーディングの後に、送信メッセージを干渉から保護するためにチャネル エンコーディングが適用されます。 チャネルコーディングでは、送信メッセージにある程度の冗長性を導入する必要がありますが、ランダムではなく、元のメッセージに存在していましたが、理論的に厳密に正当化され、指定された送信品質を保証します。

これまでのところ、ソースエンコーディングの問題のみを検討してきましたが、これからはより一般的な立場からアプローチしていきます。

したがって、アナログ音声信号のデジタルバージョン、つまり、たとえば電流の時間変化の法則を記述する関数が存在します。 このような信号から冗長性を取り除くように努める必要があります。 この問題はいくつかの方法で解決できます。 その XNUMX つは、問題の関数を純粋に数学的に分析して冗長性を見つけようとすることです。 この問題を解決するもう XNUMX つの方法は、この機能の音響特性を (聴覚器官による認識の観点から) 分析することです。 最後に、音声生成のプロセス自体をモデル化することで冗長性を探すことができます。 これは、最新のデジタル無線通信システムに応用できる最後の方法です。

音声の形成メカニズムは、声帯の倍音に富んだ音の強さと基本周波数が変化し、口腔内でさらに処理されることです。 後者は、まず共鳴器として機能し、再構築されると特定の周波数、つまり母音間の違いを決定するフォルマントを強調表示します。 次に、舌、歯、唇の動きが音を調整し、さまざまな子音を生成します。 1930 年代に、ベル電話研究所 (米国) はオイラーのアイデアに基づいた機械を製造しました。その原理は、人間の音声器官の機能をシミュレートする試みに基づいていました。

通信システムの受信側で音声を合成するには、豊富なスペクトルの可聴周波発生器、ホワイト ノイズ発生器、一連のフォルマント フィルタ (母音がほとんどないため数は少なく、それぞれが XNUMX つのフォルマントによって非常に明確に定義されている)、および変調回路が必要です。 受信側にこのような一連の機器を使用すると、通信チャネルを介して音声信号ではなく、音声合成のプロセスを制御するコマンドのみを送信することができます。 したがって、実際的なタスクは、必要なコマンドを生成する方法を見つけることです。 携帯電話の設計者が解決するのはこの問題です。

最初のリリースの GSM システムでは、伝送速度 104 kbps の音声信号の元のデジタル ストリームが 160 サンプルの個別のブロックに分割され、記録されます。 これらの各ブロックには 20 ミリ秒の時間間隔がかかります (つまり、160x13=2080 ビットのシーケンスが格納されます)。 登録されたシーケンスが分析され、その結果として、それぞれのシーケンスについて、対応する共鳴と励起信号を決定する XNUMX つのフィルター係数が見つかります。 この情報が受信機に送信され、受信機は人間の音声器官で起こるのと同じように、元の音声信号を再生します(この器官は、いわばXNUMXつのパラメータを使用して調整され、興奮すると音が得られます)。

ただし、上記の分析は比較的短期間を対象としており、隣接するブロックを含む長母音を検出できません。 したがって、長期予測は、長母音を発音する際の冗長性を排除するために使用されます。 この目的のために、送信機は送信されたシーケンスを 15 ミリ秒の期間で保存し、現在のシーケンスと比較します。 すでに送信されているシーケンスの中から、現在のシーケンスとの相関が最も高い(つまり、最も類似している)シーケンスが選択され、現在のシーケンスと選択されたシーケンスの差分のみが送信されます。 送信機に記録されたシーケンスは受信機に既知であるため、記録されたシーケンスのうちのどのシーケンスと比較したかを示す情報を送信することのみが必要です。 これにより、伝送情報量のさらなる削減が実現される。 上記の処理の結果、20 ビットを含み、伝送速度がわずか 260 kbps (つまり、元の速度の 13 分の XNUMX) である XNUMX ms のデジタル音声信号ブロックが得られます。 説明されている手順は、長期予測付き通常パルス励起 (英語の略語 PRE-LTR、通常パルス励起 - 長期予測の略) と呼ばれます。

次の段階では、チャネルコーディングが機能します。そのタスクは、通信チャネルの干渉から保護することです。 現代のコーディング技術は、代数と確率論の深いアイデアに基づいています。 これらの考えに基づいて、特定のケースごとに特定の問題を解決する、さまざまで非常に効果的なコーディング方法が開発されています。 ここでは、GSM システムで使用されているアイデアのいくつかを簡単にレビューすることに限定します。

コード保護は、エラーの事実を検出することのみを目的とすることも、発生したエラーを修正することもできます。 最初のオプションは実装がはるかに簡単ですが、あまり役に立ちません。この場合、エラーが検出されたメッセージ ブロックの再送信を要求するか、他の方法でエラーの存在を考慮する必要があるからです。 上述のソース符号化手順の過程で得られるデジタル音声信号の個々のビットは同じ重要性がないため、チャネル符号化中に 260 つのサブクラスに分割され、異なる保護方法が適用されます。 受信ブロックの 50 ビットのうち、最も重要なものは、フィルタリング パラメータ、ブロック信号の振幅、および長期予測のパラメータに関する情報を運ぶビットです。 これらのビットは、いわゆるサブクラス Ia (132 ビット) に属します。 次に、サブクラス Ib (ポインターと通常の励起パルスに関する情報、および長期予測のパラメーターを含む 78 ビット) が続きます。 残りの XNUMX ビットはクラス II です。

デジタルセルラーシステムにおける音声コーディング

記述されたブロックを保護するために、260 つのコーディング方法が使用されます。 まず、ブロック コードを使用して、訂正されずに残っているエラーを検出します。 このコードは巡回コードのクラスに属しており、各コードの組み合わせは要素の巡回並べ替えによって取得されます。 このコードでエンコードすると、さらに XNUMX つのチェック ビットがサブクラス Ia のビットに追加され、これによってデコーダはこのサブクラスに未訂正のエラーが含まれているかどうかを判断できます。 デコーダがサブクラス Ia ビットの送信エラーを検出すると、XNUMX ビットの会話フレーム全体が破棄されます。 この場合、失われたフレームは、前のフレームの情報に基づいて補間によって再生されます。 この解決策では、サブクラス Ia の誤ったビットを再生する場合よりも伝送品質が向上することがわかりました。 次に、畳み込み符号を適用してエラーを修正します。 このコードの名前は、エンコードされたビット シーケンスの処理を記述する関数に適用される畳み込みの数学的演算によって説明されます。 ブロック コードとは異なり、畳み込みコードは、適用されるとき、エンコードおよびデコード プロセスが固定ブロックではなく、連続的に実行されるシンボル シーケンスで実行されるという意味で連続的です。

畳み込みコードは、チェック ビットとともにサブクラス Ia のビットとサブクラス Ib のビットの両方に適用されます。 これら 2 つのシーケンスは結合され、1 ビットずつ増加します (図 2 を参照)。これらのビットはゼロ値をとります。 後者は、エンコード後にエンコーダを元の状態に戻す役割を果たします。 適用されたコードは、パラメーター r=5/1 および K=2 によって特徴付けられます。 係数 r=5/1 は、エンコーダ入力に入る各ビットに対して、エンコードされたシーケンスで正確に 2 ビットが得られることを示し、K=189 は、畳み込み演算でカバーされる接続の長さを示します。 これらの特徴は、図に示す畳み込み符号化方式から理解できます。 図1は、モジュロ2加算スキーム(論理演算「排他的OR」)も示している。 したがって、エンコードの結果として、入力378ビットから456ビットが得られ、保護されていないクラスIIビットがそれらに追加され、その結果、合計のブロック長は2ビットになります(図57)。 これは、XNUMX ビットの XNUMX つのサブブロックです。 このようなサブブロックから、時分割による無線送信のバーストが形成されます。

デジタルセルラーシステムにおける音声コーディング

この記事では音声信号の符号化の問題を取り上げますが、これまでの説明からわかるように、小型携帯電話機に搭載されるプロセッサの割合はデジタル処理のかなりの部分を占めます。 ただし、プロセッサのタスクはまだ使い果たされていません。 ご存知のとおり、セルラー通信システムでは、音声伝送の代わりに、まったく異なるルールに従ってエンコードされたデータ伝送チャネルを編成できます。 しかし、携帯電話機には、有益な(有料の)情報を送信するための論理チャネルに加えて、制御信号を送信するための論理チャネルが多数編成されている。 これらの論理チャネルのそれぞれは、情報をエンコードするための特定の要件に従うため、そのような各チャネルがプロセッサの負荷に寄与します。

コーディング方式の一般的な考え方と、無線電話通信システムのすべての論理チャネルを送信するためのフラッシュの形成を図に示します。 3.

デジタルセルラーシステムにおける音声コーディング

ここでは、0 個の異なる論理チャネルが最上位に表示され、これらのチャネル内のメッセージ ブロックのサイズが示されています (特定の数字または文字 (P0、N3 など) の形式で、これらの数字は変更される可能性があります)。 次のレベルは、さまざまな論理チャネルのエンコードの第 456 段階を示し、元のシーケンスとエンコード後に取得されたシーケンスのビット数を示します。 巡回誤り検出符号が音声チャネルに使用される場合、一連の誤りを訂正する Fire 巡回符号など、さまざまな誤り訂正巡回符号が残りのチャネルに使用されます。 エンコードの第 57 段階では、すでに述べた畳み込みコードが適用されます。 さらに (ステージ XNUMX)、受信した XNUMX ビットを個々のバースト (それぞれが XNUMX ビットの XNUMX つのブロックを運ぶ) に分配するために、ビット混合とブロックの置換 (直接または対角転置) の操作が適用されます。

携帯電話における信号処理の総量は、XNUMX 秒あたり数百万回と推定されています。 したがって、従来の電話とは異なり、携帯電話は小型ですが、非常に生産性の高いコンピューターです。 一方では、このコンピュータは「独自の」音声信号を分析し、対話者の装置内で音声合成のための制御コマンドを開発します。他方では、このコンピュータはオイラーのアイデアを実装し、通信チャネルから来る制御コマンドに従って対話者の音声を合成します。

著者:V。Neumann、教授、技術博士。 科学、モスクワ

他の記事も見る セクション モバイル通信.

読み書き 有用な この記事へのコメント.

<<戻る

科学技術の最新ニュース、新しい電子機器:

光信号を制御および操作する新しい方法 05.05.2024

現代の科学技術は急速に発展しており、日々新しい手法や技術が登場し、さまざまな分野で新たな可能性を切り開いています。そのような革新の 1 つは、ドイツの科学者による光信号を制御する新しい方法の開発であり、これはフォトニクス分野での大きな進歩につながる可能性があります。最近の研究により、ドイツの科学者は石英ガラス導波管内に調整可能な波長板を作成することができました。液晶層の使用に基づくこの方法により、導波路を通過する光の偏光を効果的に変化させることができる。この技術的進歩により、大量のデータを処理できるコンパクトで効率的なフォトニックデバイスの開発に新たな展望が開かれます。新しい方法によって提供される偏光の電気光学制御は、新しいクラスの集積フォトニックデバイスの基礎を提供する可能性があります。これにより、次のような大きな機会が開かれます ... >>

プレミアムセネカキーボード 05.05.2024

キーボードは、私たちの毎日のコンピューター作業に不可欠な部分です。ただし、ユーザーが直面する主な問題の 1 つは、特にプレミアム モデルの場合、騒音です。しかし、Norbauer & Co の新しい Seneca キーボードでは、状況が変わるかもしれません。 Seneca は単なるキーボードではなく、完璧なデバイスを作成するための 5 年間の開発作業の成果です。このキーボードは、音響特性から機械的特性に至るまで、あらゆる側面が慎重に考慮され、バランスがとられています。 Seneca の重要な機能の 1 つは、多くのキーボードに共通するノイズの問題を解決するサイレント スタビライザーです。さらに、キーボードはさまざまなキー幅をサポートしているため、あらゆるユーザーにとって便利です。 Seneca はまだ購入できませんが、夏の終わりにリリースされる予定です。 Norbauer & Co の Seneca は、キーボード設計の新しい標準を表します。彼女 ... >>

世界一高い天文台がオープン 04.05.2024

宇宙とその謎の探索は、世界中の天文学者の注目を集める課題です。都会の光害から遠く離れた高山の新鮮な空気の中で、星や惑星はその秘密をより鮮明に明らかにします。世界最高峰の天文台、東京大学アタカマ天文台の開設により、天文学の歴史に新たなページが開かれています。アタカマ天文台は海抜 5640 メートルに位置し、天文学者に宇宙研究の新たな機会をもたらします。この場所は地上望遠鏡の最高地点となり、研究者に宇宙の赤外線を研究するためのユニークなツールを提供します。高地にあるため空はより澄み、大気からの干渉も少なくなりますが、高山に天文台を建設することは多大な困難と課題を伴います。しかし、困難にもかかわらず、新しい天文台は天文学者に研究のための広い展望をもたらします。 ... >>

アーカイブからのランダムなニュース

新しいファイバー速度記録 04.04.2016

米国イリノイ大学のエンジニアは、室温で毎秒 57 ギガビットという信じられないほどの速度で接続できることを示しました。 この技術は、カリフォルニアで開催された光ファイバー通信に関する会議で発表され、それに関する記事が会議の議事録に掲載され、大学のウェブサイトでも開発について簡単に説明されています。

速度は室温で正確に達成され、データ転送はテストで示されているように、ほとんどエラーなしで行われるため、新しいテクノロジーは私たちの日常生活に入る大きなチャンスがあります. この速度では、たとえば Blu-ray ムービーは数秒以内にロードされます。 これは、今日のソリッド ステートの「ハード ドライブ」からデータを読み取るよりも XNUMX 桁高速です。

この方法が、摂氏 50 度までの高温で最大 85 ギガビット/秒という高い結果を示したことも重要であり、この技術は産業用アプリケーションに有望です。

科学者が使用するレーザーは、いわゆる垂直放射型(VCSEL)で、現在稼働中の一部のシステムですでに使用されています。 特定のタスクに対して、薄くて効率的な光パルスを使用します。

もちろん、そのような高速の主な用途は映画のダウンロードではありません。 まず第一に、ビッグデータを効率的に扱うために必要です。 たとえば、Google や Facebook などの最大の IT 企業の巨大なデータ センターで使用でき、高温でも速度が高いままであるため、サーバーの冷却に膨大な量のエネルギーを費やす必要がなくなります。

その他の興味深いニュース:

▪ 奪う海賊 MP3

▪ LG Tone Infinim ワイヤレス ヘッドセット

▪ MIPI CSI-2 仕様 v1.3

▪ ペンタックス AF201FG 全天候フラッシュ

▪ フクロウの翼の静かな飛行機

科学技術、新しいエレクトロニクスのニュースフィード

 

無料の技術ライブラリの興味深い資料:

▪ サイトのインターホンのセクション。 記事の選択

▪ プーシキン・アレクサンダー・セルゲイビッチの記事。 有名な格言

▪ 記事 間欠泉の水はなぜ熱いのですか? 詳細な回答

▪ 記事 砂漠地帯での移動。 観光のヒント

▪ 記事 金属の前処理。 簡単なレシピとヒント

▪ 記事 魔法の杖。 フォーカスシークレット

この記事にコメントを残してください:

Имя:


Eメール(オプション):


コメント:





このページのすべての言語

ホームページ | 図書館 | 物品 | サイトマップ | サイトレビュー

www.diagram.com.ua

www.diagram.com.ua
2000-2024