andy_shev: (Default)
[personal profile] andy_shev
Чё-то я забыл, есть ли возможность в iconv декодировать замаскированные юникодные символы *ML в нормальные (те, которые &#XXXX;). "Мировой разум" сходу не дал ответ на вопрос.

Отделался по-быстрому скриптом на python'е:
import re
digre=re.compile('&#(\d\d\d\d);', re.U)
x=open("coolfilename").read()
sp=re.subn(digre, lambda y: unichr(int(y.group(1))).encode('utf-8'), x)[0]
open("cooloutput","w").write(sp)


links -dump file.html конечно конвертирует, только вот форматирование полностью портит.

P.S. Пора возвращать документацию в систему :)

Profile

andy_shev: (Default)
Andy Shevchenko

March 2025

S M T W T F S
      1
2345678
9101112131415
16171819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 27th, 2025 05:09 am
Powered by Dreamwidth Studios