Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Mikhail Polykovsky                   2:5020/400     09 Jun 2004  11:24:44
 To : Andrew Alakozow
 Subject : Re[2]: Хэш?
 -------------------------------------------------------------------------------- 
 
 
 MP>> У меня есть ~8 млн. уникальных строк (20 символов). Hекоторые
 MP>> дублируются. Обработка идет посторочно. Мне нужно знать, обрабатывал я
 MP>> такую строку уже, или нет. Я пробовал BerkleyDB (tie( %str,
 MP>> "DB_File", $filename)), очень долго. MySQL с одним полем и индексом по
 MP>> нему быстрее, но тоже медленно (правда я делал не select, а пытался
 MP>> insert, если не получалось, складывал в таблицу дублирующих).
 MP>> Простой хеш не помещается в памяти. Что посоветуете?
 
 AA> http://www.perl.com/pub/a/2004/04/08/bloom_filters.html
 
 Это конечно здорово, но вероятность ошибки, хоть и маленькая, меня
 нисколько не радует.
 -- 
 Михаил Полыковский
 http://copi.ru/27690/
 Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
 --- ifmail v.2.15dev5.3
  * Origin: UTC (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re[2]: Хэш?   Mikhail Polykovsky   09 Jun 2004 11:24:44 
 Re: Хэш?   yurik shestakov   09 Jun 2004 12:11:40 
 Re[2]: Хэш?   Bulat Ziganshin   22 Jun 2004 14:46:54 
Архивное /ru.perl/909657b6e8b7.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional