dil | Новости алгоритмов сжатия

You're viewing

dil's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

November 2019

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Navigation

Page Summary

lazylonelion.livejournal.com - (no subject)

Style Credit

Style: Blue for Drifting by Jennie Griner
Resources: OSWD design

Expand Cut Tags

No cut tags

Граждане, а как это так получается, что MP3 256 кбит/c VBR сжимаются rar'ом? Причём так заметно сжимаются - compression ratio в районе 70%.

Это какие-то такие специальные mp3, или я пропустил великое открытие?

Tags:

программистское

Flat | Top-Level Comments Only

no subject

lazylonelion.livejournal.com

Friday, June 13th, 2008 09:19 am (UTC)

???
%)
круто...

no subject

dil.livejournal.com

Friday, June 13th, 2008 09:26 am (UTC)

Вот: 6.5 MB (http://dil.pp.ru/mp3/strange.rar)

 Name             Size   Packed Ratio  Date   Time     Attr      CRC   Meth Ver
-------------------------------------------------------------------------------
 strange.mp3   9596928  6782534  70% 15-03-08 04:46 -rw-r--r-- 67D42CF6 m5g 2.9
-------------------------------------------------------------------------------
    1          9596928  6782534  70%

no subject

lazylonelion.livejournal.com

Friday, June 13th, 2008 09:30 am (UTC)

:))
Скоро будут лосслесс-форматы, которые сжимают МР3 в какой-нить МР7, как когда-то РСМ появился после WAV.

no subject

dil.livejournal.com

Friday, June 13th, 2008 09:33 am (UTC)

у меня пока только одно предположение: оно пережато из более низкого битрейта, поэтому часть полосы просто не используется и забита заполнителями, вот они и сжимаются.

no subject

dil.livejournal.com

Friday, June 13th, 2008 09:36 am (UTC)

там частоты выше 18.5 кГц срезаны. фигня какая-то

no subject

grayw.livejournal.com

Friday, June 13th, 2008 10:32 am (UTC)

не "скоро будут" а "уже есть". SoundSlimmer тот же.

no subject

dil.livejournal.com

Friday, June 13th, 2008 10:56 am (UTC)

"Current version of SoundSlimmer losslessly compresses Mp3 and Mp3Pro files averaging 20% less file size"

С одной стороны, если я правильно понял их объяснения, они на последнем этапе сжатия аудиоданных вместо кодирования по Хаффману используют какой-то проприетарный алгоритм, якобы, сильно более эффективный. И обещают, что его можно применить и к другим аналогичным случаям - ogg, wma и т.п.

Но при этом оно works with audio data only utilizing certain specifics of digital sound signals. Какая такая специфика аудио остаётся к этому этапу, я не понимаю. А если б это было эффективный алгоритм общего назначения, то его можно было бы применить и к видео в MPEG2/MPEG4, оно в конце точно так же сжимается.

как-то оно.. не то, чтобы фейком попахивает, но некоторое недоверие вызывает

no subject

alec_v.livejournal.com

Friday, June 13th, 2008 08:42 pm (UTC)

Небось техномузыка хорошо жмется, повторений много. :)

no subject

grayw.livejournal.com

Saturday, June 14th, 2008 07:47 am (UTC)

да не фейк это, автор алгоритма (Женя Шелвин) в среде людей занимающихся сжатием данных человек известный и уважаемый, не с руки ему людей обманывать :)

у всех алгоритмов сжатия аудио с потерями общий подход одинаков - данные переводятся в спектральный вид (Фурье, MDCT, вейвлеты и т.п.), далее часть полученных коэффициентов отбрасывается, оставшиеся квантизируются, после этого идет самый "творческий этап" - так как между коэффициентами есть корреляция, ее тем или иным способом используют для снижения энтропии потока данных. ну и после этого завершающим этапом идет собственно энтропийное кодирование, как правило по Хаффману.

так вот, все распространенные алгоритмы сжатия аудио эксплуатируют имеющуюся корреляцию данных весьма слабо, используя самые простые алгоритмы - чтобы сделать простой аппаратную реализацию и чтобы формат без проблем декодировался на слабых процессорах. Женя же построил более сложную модель данных, лучше предсказующую поступающие на ее вход коэффициенты, за счет чего и получает выигрыш в сжатии. но это не бесплатный сыр, за улучшенное сжатие приходится платить процессорным временем. ну и дожатие арифметическим кодером (или рейнжкодером) вместо Хаффмана тоже дает небольшой выигрыш.

что именно имелось в виду под certain specifics не берусь сказать, возможно это просто маркетинговый bullshit. на практике, скорее всего, мп3 и аналоги используют корреляцию коэффициентов только внутри одного фрейма данных (от последнего произведенного преобразования), а Женина модель использует контекст из некоторого количества предыдущих фреймов.

алгоритм, само собой, не общего назначения. для каждого возможного источника данных нужно строить свою уникальную модель данных, только так можно получить заметный выигрыш. для вариантов форматов сжатия аудио модели будут достаточно похожи, отсюда и прогнозы на создание дожимателей огг и вма. для видео данных модель будет уже сильно отличаться, все таки поток данных не одномерный а трехмерный, плюс вычислительная сложность алгоритма будет очень большой, а кодирование видео и нынешними кодерами процесс неторопливый.

ну и отдельная головная боль - в своем формате реализовать возможность bit-to-bit identical расжатие мп3, а не только воссоздание "так же звучащего" мп3. сохранение всякой служебной информации мп3, паддинга и прочего, что в спецификации формата не фиксировано и различается в разных реализациях кодеров. задача не легче чем создание собственно "дожимателя". и есть у меня подозрение, что именно эта проблема останавливала других желающих написать "дожиматели" мп3.

кстати, есть и безпотерьные "дожиматели" для zip, pdf и jpeg, подход при их создании аналогичный.

no subject

dil.livejournal.com

Monday, June 16th, 2008 09:06 am (UTC)

но в разных алгоритмах сжатия звука методика разложения в спектр разная. значит, для эффективного дожатия надо учитывать особенности не просто звука, а конкретного алогоритма. для mp3 одно, для ogg другое, для wma третье.. для какого-нибудь MPEG2 video - четвёртое, и не сильно сложнее, чем для аудио.

no subject

motto.livejournal.com

Saturday, June 14th, 2008 09:04 am (UTC)

ну, много чего бывает
вспомни, как G.729 устроен. На "шпецифик дата" всякое может быть

Flat | Top-Level Comments Only

файл отрицательного размера

переезжаем из жежешечки

November 2019

Navigation

Page Summary

Style Credit

Expand Cut Tags

Новости алгоритмов сжатия

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject