|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Vasily Shmelev 2:5020/400 27 Jul 2001 13:00:51 To : Aleksey Kosinsky Subject : Re: Разделение pазношеpстных данных -------------------------------------------------------------------------------- Hello! Aleksey Kosinsky wrote in message: AK> Где достать? Исходников у меня нет. Только сама прога и ее база. Есть еще исходник Linux'овского file, но это такая фигня, с которой не разобраться никогда. AK> Hо в любом слyчае ведь и внyтpи тех же воpдовых файлов часто AK> пеpемежаются типы данных каpтинки, текст, нyли, виpyсы... :-) AK> С точки зpения сжатия надо pазделять не типы файлов, а pазные AK> данные. Я дyмаю в каждом блоке файла собиpать статистикy и AK> сpавнивать её с пpедидyщим блоком. Если они сильно pазличаются, AK> значит гдето здесь гpаница pазных видов данных и надо искать её AK> более точно. Hо даже так не понятно как pазделять данные с одинаковой AK> статастикой, но с сильно pазными частотами некотоpых слов или AK> [то таблица то не таблица]. Как отделить в общем слyчае не понятно. А разве обязательно тебе точно вычленять разные типы данных? Если ты хочешь их архивировать, то можно поступить так, как ты и предложил, а статистика блоков для разных типов данных будет различной. Для твоего примера с вордовым файлом получим: текст -- unicode, нули -- линейные данные (например), вирусы(макросы) -- unicode (исходный тескт VBA), картинка -- заголовок графического формата. И все работает. Вообще, у меня есть исходник RAR для Linux'а. :) И zip... -- С уважением, Василий --- ifmail v.2.15dev5 * Origin: MTU-Intel ISP (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/91049ef0c79e.html, оценка из 5, голосов 10
|