Цифровое аудио – это представление аналогового звука, которое используют компьютеры и различные цифровые устройства для записи и воспроизведения аудио информации. По принципу кадров в кино цифровой аудио сигнал создаётся из серии фрагментов звука, которые воспроизводятся, когда мы нажимаем на кнопку play. Существует масса различных форматов цифрового аудио, они отличаются друг от друга качеством передачи звуковой информации.
О Pulse Code Modulation – PCM
Если мы говорим об акустическом звуке или аналоговом сигнале, то речь всегда идёт о распространении звуковых волн в пространстве. В то время как цифровое аудио – это лишь приближенное описание того, что происходит со звуком или должно происходить внутри компьютерных программ или цифровых устройств.
В этой статье пойдёт речь об импульсно кодовой модуляции (Pulse Code Modulation – PCM) – наиболее распространённой системе декодирования цифрового аудио. Помимо PCM, также существуют системы DTS и Dolby Digital, но они в основном применимы в области кино и видео производства. О них мы сегодня говорить не будем.
Что такое DoP (DSD over PCM)?
В импульсно-кодовой модуляции сигнал считывается множество раз в секунду. В каждый момент считывания, записывается и воспроизводится амплитуда звуковой волны. Как было сказано ранее, цифровой сигнал – это лишь приближенная копия аналогового сигнала, так как аналоговая волна не может быть воссоздана идеально точно. Значения каждого фрагмента округляются в сторону ближайшего наиболее точного, затем все фрагменты воспроизводятся, и мы слышим копию оригинального аналогового звука.
«О каких значениях идёт речь?» – спросите вы. Также как аналоговый звук определяется параметрами частоты и амплитуды, цифровое аудио определяется двумя важными значениями: частотой дискретизации (sample rate) и разрядностью или битностью (bit depth). Частота дискретизации означает, сколько раз в секунду считываются фрагменты звукового сигнала, а разрядность – величина динамического диапазона каждого фрагмента звукового сигнала.
Частота Дискретизации
Стандартная частота дискретизации в 44.1 кГц, которая используется для записи аудио на компакт диски (помните такие?), может показаться неким случайно выбранным числом. Но это совсем не так. Эта величина была выбрана исходя из теоремы Котельникова, которая по сути утверждает, что частота дискретизации должна быть более чем в 2 раза выше максимального значения считываемой частоты.
Как известно, верхний предел слышимости частотного диапазона человеческого слуха – 20 кГц. Получается, что частота дискретизации должна быть больше 40 кГц. Дополнительные 4.1 кГц добавляются, чтобы избежать искажений, так называемого эффекта наложения (aliasing). В теории 44.1 кГц должно быть вполне достаточно, чтобы с большой точностью передать звуковой сигнал, однако, существуют и более высокие значения.
Например, 48 кГц – стандарт доминирующий в кино и видео производстве. Как в случае с кино, звук синхронизируется с частотой смены кадров равной 24 кадрам в секунду. Не будем вдаваться в подробности, почему именно 24 кадра в секунду были выбраны, проще говоря, это минимальная частота, при которой мы можем видеть плавную приятную для глаз картинку.
Как подключить звук на телевизоре от компьютера через HDMI.Почему нет звука по HDMI на телевизоре
Частота дискретизации должна соответствовать такой смене кадров. Использование частоты в 44.1 кГц может привести к заметной рассинхронизации картинки и звука. Опять же, исходя из теоремы Котельникова.
Еще более высокие частоты дискретизации отталкиваются от этих двух базовых частот 44.1 или 48 кГц, умножая их с коэффициентами кратными 2. То есть 88.2, 96, 192 кГц – стандарты частот дискретизации всего современного звукового оборудования.
Разрядность
Разрядность или битность аудио файла говорит нам о его динамическом разрешении или, проще говоря, чёткости. Можно провести аналогию с цифровой фотографией: чем выше разрешение фото, тем чётче и качественнее картинка.
Тут важно отметить, что речь не идёт о громкости сигнала, речь идёт скорее о более реалистичном, более чистом и чётком звуке. Более точной передачи звукового сигнала.
Разрядность можно сравнить с текстом в книге. Чем ниже разрядность, тем меньше смысла в тексте. То есть понижение битности приводит к тому, что из слов начинают исчезать некоторые буквы, из предложений – знаки препинания. До поры до времени мы еще сможем уловить смысл текста, но если разрядность продолжит уменьшаться, информация исказится настолько, что мы просто перестанем понимать, о чём идёт речь. Со звуком тоже самое: чем меньше разрядность, тем более искажённо мы слышим звук.
Вот небольшой список наиболее распространённых значений разрядности:
1. 4-bit – максимальный динамический диапазон 24 дБ. Иногда используется для экстремальных «лоу фай» эффектов и нарочитых искажений
2. 8-bit – максимальный динамический диапазон 48 дБ. Использовалось в ранних моделях аудио/видео устройств, таких как первые игровые консоли
3. 12-bit – максимальный динамический диапазон 72 дБ. Первые электронные музыкальные инструменты работали именно в такой разрядности. Пример – легендарный сэмплер EMU Sp-1200
4. 16-bit – максимальный динамический диапазон 96 дБ. Стандарт аудио записи. Именно в такой разрядности записывается звук на компакт диски.
5. 24-bit – максимальный динамический диапазон 145 дБ. В основном используется при профессиональной записи аудио информации.
6. 32, 64-bit – наиболее чистый сигнал с максимальным разрешением, позволяет добиться максимального качества передачи информации. Однако, пока такая разрядность не получила широкого распространения.
PCM аудио может быть представлен в виде множества форматов, но все их можно поделить на две категории: без потери качества (lossless) и с потерей качества (lossy). Форматы первой категории прекрасно справляются с передачей звуковой информации в её, можно сказать, первозданном виде. Но аудио записи в таких форматах обычно занимают довольно много места на жёстком диске.
Форматы из категории lossy сжимают (компрессируют) аудио сигнал, что приводит к ухудшению качества звука. То есть качество аудио напрямую зависит от степени сжатия. С другой стороны, подобные записи занимают гораздо меньше места. Вот небольшой список наиболее часто используемых форматов lossless и lossy:
1. WAV (Waveform Audio format). Наиболее распространённый формат нескомпрессированного аудио, используемый в большинстве оборудования для записи и воспроизведения аудио. Broadcast WAV (.BWF) формат, который также может нести информацию о мета данных.
2. AIFF (Audio Interchange File Format). Тоже самое, что WAV, но используемый, в основном, устройствами компании Apple.
3. FLAC (Free Lossless Audio Codec). Формат, который хоть и сжимает аудио информацию, но делает это наиболее щадящим образом практически без потери качества. Минус формата в том, что он поддерживается далеко не всеми аудио устройствами.
4. ALAC (Apple Lossless Audio Codec). Уступающий по качеству FLAC формат, тем не менее поддерживается всеми устройствами Apple.
1. Mp3 (Mpeg Audio Layer III) – наиболее популярный формат сжатия аудио информации. Широко использоваться стал по большей части на волне популярности портативных аудио плееров.
2. AAC (Advanced Audio Coding) –альтернатива mp3, несколько превосходящая его по качеству.
3. OGG (Ogg Vorbis) – формат с открытым кодом. Еще одна альтернатива mp3, которая поддерживается и используется Wikipedia, Spotify и некоторыми видео играми.
Источник: beyondmusic.ru
Какой «цифровой аудиовыход» лучше, PCM или RAW 2022
Если вы ищете простую статью на тему «Какой цифровой аудиовыход лучше, PCM или RAW», то вы попали по адресу.
У RAW и PCM есть свои плюсы и минусы.
Качество звука не должно отличаться независимо от того, какой формат вы выбрали: RAW или PCM.
Однако есть вероятность, что RAW обеспечит лучшее качество цифрового звука, если ресивер хороший.
Если ваш звуковой приемник имеет более низкое качество, тогда PCM должен давать более качественный звук, поскольку он работает со сжатием звука.
Знаете, что делает людей любопытными? Вот несколько вопросов и ответов:
Лучший «цифровой аудиовыход», PCM или RAW
Что лучше PCM или Dolby Digital.
Фокал Сиб Эво Долби Атмос 5.1. 2 акустическая система.…
Что лучше PCM или цифра.
Если единственное, что у вас есть, — это динамики телевизора для развлечения, настройка PCM — лучший вариант, поскольку в нем отсутствует сжатие. Вы услышите приглушенные тона и меньшую четкость звука при использовании настройки Dolby Digital со стандартной настройкой.
Является ли PCM звуковой панелью с максимальной громкостью.
Это, безусловно, самый высокий выходной объем. Если я выбираю RAW или Dolby, громкость падает примерно на 75%. С PCM звук большинства HD-контента отображается как 5.1 AC3, что, как я полагаю, правильно? Есть ли какая-то польза от двух других опций, где мне нужно существенно увеличить громкость? Если стереофоническая звуковая панель, выберите то, что дает наилучший результат.
Как записать необработанные аудиоданные PCM.
Немного теории. Я должен рассказать вам о некоторых основах обработки сигналов, чтобы вы могли получить полную картину. .
Видео: PCM лучше, чем Dolby Digital.
Посмотрите это видео по теме: «Лучше ли PCM, чем Dolby Digital. »
Совет: включите кнопку подписи, если она вам нужна. Выберите «автоматический перевод» в кнопке настроек, если вы не знакомы с английским языком.
Эти запросы также появляются время от времени:
В чем разница между PCM и необработанным звуком.
Если вы выводите необработанный звук (часто называемый битовым потоком), то ресивер сделает это. Если вы настроите проигрыватель на вывод PCM, то проигрыватель будет выполнять декодирование, а ресивер просто обрабатывает DSP, управление динамиками, цифро-аналоговое преобразование и регулировку громкости. Что лучше? Это совершенно новый аргумент.
PCM лучше, чем Dolby Digital.
Таким образом, в зависимости от потребности в передаваемых данных импульсно-кодовая модуляция становится лучшим вариантом, чем Dolby Digital. Несжатый PCM. При импульсно-кодовой модуляции звук передается несжатым, что сводит к минимуму потерю данных при сжатии. Форматы синего луча в импульсно-кодовой модуляции слегка сжаты, что делает импульсно-кодовую модуляцию лучшим выбором, чем Dolby Digital. Среды передачи
Если вы выберете PCM или оптическое аудио.
Если это важная функция, которую вы хотите иметь для своей звуковой системы, то PCM — лучший вариант для вас. Ваши возможности могут быть ограничены для PCM, если вы собираетесь настроить свою звуковую систему для цифрового оптического аудио или коаксиального соединения.
Является ли звук PCM высококачественным.
PCM и Bitstream: основные отличия Это означает, что сигнал не кодируется дополнительно, например, DTS или Dolby Digital, и поэтому не преобразуется. Как PCM, ваш сигнал чистый и, как правило, самого высокого качества. Занимает много места, но звучит очень хорошо.
Является ли цифровой аудиовыход таким же, как наушники.
Для вывода звука через наушники и саундбар: подключите наушники к разъему для наушников на телевизоре, а саундбар к порту DIGITAL AUDIO OUT. Примечание. Если вы подключаете звуковую панель к портам HDMI или через Bluetooth, телевизор не сможет одновременно выводить звук из наушников и звуковой панели.
Что такое PCM и необработанный цифровой аудиовыход.
PCM и RAW являются методами вывода звука, и самая большая разница заключается в том, что RAW напрямую выводит звук на следующее устройство без кодирования, что является так называемым выходом источника звука; ИКМ — это сокращение от импульсно-кодовой модуляции.
Каковы лучшие аудиокодеки для качества звука.
Поскольку для передачи сжатых данных не требуется большая полоса пропускания, ваша звуковая система может использовать лучшие аудиокодеки для вывода, включая Dolby TrueHD, Dolby Atmos, DTS HD Master Audio и DTS:X.
Что такое необработанный аудиовыход.
Необработанный аудиофайл — это любой файл, содержащий неконтейнерное и несжатое аудио. Данные хранятся в виде необработанных значений импульсно-кодовой модуляции (ИКМ) без какой-либо информации заголовка (такой как частота дискретизации, битовая глубина, порядок байтов или количество каналов).
Надеюсь, вам понравился этот пост.
Ищете новый телевизор?
Выбор телевизора может быть очень сложным, если вы ничего не знаете о технологиях.
Некоторые будут платить за функции, которые им не нужны, в то время как другие могут не учитывать то, что им действительно нужно.
Поэтому я создал это краткое руководство для новичков, которое поможет вам сосредоточиться на том, что действительно важно для вас:
Источник: www.ru-tech.gelsonluz.com
Статьи
Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.
На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.
Три наиболее популярных аудиокодека: Pulse-Code Modulation ( PCM), MP3 и Advanced Audio Coding ( AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.
При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.
К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.
MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.
AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.
Частота дискретизации (кГц, kHz)
Частота дискретизации (или частота сэмплирования) — частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.
Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.
Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.
Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.
Разрядность
Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала.
Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.
Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.
Битрейт
Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.
битрейт = частота дискретизации × разрядность × каналы
Для таких систем как Epiphan Pearl Mini, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:
44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с
Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.
Частота дискретизации, разрядность и битрейты в реальной жизни.
Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.
Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.
Наши рекомендации
CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.
Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.
При записи аудио с видео…
В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl Mini.
При потоковой передаче аудио с видео…
При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.
Последние статьи
Подпишитесь на нашу рассылку, чтобы узнавать о новых статьях:
- H.264/AVC или H.265/HEVC: Краткий гид по сжатию видео
- SRT или NDI для удалённого видеопроизводства
- Новинки Pearl: Новый MultiViewer и улучшения в CMS
- NDI и NDI|HX для сетевого производства видео
- Поддержка NDI для «комнат» в Zoom и производство видео в реальном времени
- Pearl Nano: улучшенное качество записи и трансляций
- Почему виртуальные мероприятия будут в выигрыше и после пандемии
- 5 причин, почему виртуальные мероприятия останутся с нами
- Дикий Запад удаленного видеопроизводства
- Выбор камеры для стримов в 2021 году
- Epiphan Cloud: простое управление несколькими устройствами
- Аудиооборудование для трансляций
- 7 непростых уроков о видеопроизводстве
- Видео 4K для онлайн трансляций
- Искусственный интеллект и транскрибирование в реальном времени
- HyFlex: новый формат в образовании
- Удалённый гость на стриме: что и как
- Где может пригодиться кадрирование?
- KVM2USB: 6 лет работы в космосе
- Как лучше выглядеть в Скайпе и Зуме: 5 простых советов
Источник: epiphan.ru