Home > Программирование > Прогерское

Прогерское

Вчера скачал базу данных русской википедии. Неплохо она разрослась – целых 1,2 Гб в распакованном виде. Нашел даже XML парсер Перловый для этой базы данных. Работает медленно на полный парс уходит больше минуты (но на Си переписывать не очень хочется). Ещё проблема с кодировками. Мб кто поможет как задать строчку в обычном текстовом виде и конвертировать её в UTF средствами перл и наоборот? Че то Encode не работает. =(
В планах выдрать оттуда все что касается кино и использовать для своего проекта.

  1. July 7th, 2007 at 20:48 | #1

    а libiconv чем не перекодировка?

  1. No trackbacks yet.