Как перекодировать 1251 в UTF-8

Раздел: Программы, Советы
Написано: 25.03.2010
Автор: Antonio
Просмотров темы: 15,576 раз

Возникла задача перекодировать файлы сайта в формат UTF-8, а до этого данные файлы были созданы в кодировке WINDOWS-1251.

Вроде бы задача тривиальная - берем любой кодировщик и кодируем из widows-1251 в utf-8, но не тут то было, так можно делать если у нас десяток файлов.

А если файлов тысяча? Да и еще не скопом, а каждая группа в своей подкатегории!

convert to utf-8 no BOM


Сразу в голову приходит идея - берем пакетный перекодировщик файлов и кодируем одним мановением мыши.

Кстати хочу заметить файлы у меня лежали на виртуальном сервере, и диск с файлами был подключен как обычный сетевой диск. Т.е. без всяких фтп и прочего, хотя конечно все это есть.

И так, необходим конвертер для пакетной кодировки в UTF.

И пакетной по-настоящему, а не выбрали кучу файлов и кодируем, чтобы можно было добавлять начальную директорию, а файлы кодировались рекурсивно.

После тщательных поисков было найдено решение!

Есть замечательный бесплатный конвертер для пакетного конвертирования в UTF - UTFCast Express - скачать конвертер UTFCast Express.

Он позволяет легко и быстро в автоматическом режиме перекодировать каталог и все файлы в подкаталогах. Но у него есть небольшая особенность! Так как версия Экспресс бесплатная - то она не имеет опции конвертировать в UTF-8 без BOM (BOM - Byte Order Mark, служит для идентификации кодировок UTF)

Недостаток результата конвертирования такой, что ваши PHP скрипты скорее всего не будут работать! А вот для решения этой проблемы необходимо применить вторую программку - скачать utf8-bom-remover.exe - UTF-8 BOM Remover

Эта тоже замечательная программа - прекрасно справляется с удалением BOM в UTF файлах. А главное рекурсивно все содержимое каталога и подкаталогов!

Вот такой связкой можно решить такой важный вопрос.

До этого я пересмотрел программы:
Smart Recoder 1.6.2b - не работает с UTF-8
TEA 26.2.0, TEA 27.0.1 - крутой редактор, но я не понял как его можно применить для этих целей, хотя некоторые пишут что можно
Encoding Master 1.63 - можете попробовать, но при добавлении моей директории он подвисал
Notepad++ (NPP) - классный, гибкий редактор, но как таковой рекурсивной простой и удобной перекодировки нет, но можно легко убирать BOM
AkelPad - можно вручную сохранять в UTF-8 без BOM
коммандер FAR с плагином FarTrans - при обработке 1010 файлов php плагин вылетал в течении 3-х секунд, пробовал несколько раз
Ansi2Uni - классный маленький конвертер, но с несовсем рекурсией
Russian Anywhere 4.62 - навороченный конвертер, но как-то не пошел
Kaboom - вроде было все что нужно, вот только с рекурсией не удалось
UTF8_convert - минимум кнопок, но нет возможности выключать BOM
ABConverter - не работает с UTF

Если есть желание и возможности заплатить 30$, то рекомендую купить платную версию UTFCast Professional очень мощный, гибкий и удобный конвертер (по крайней мере мне так показалось)

P.S. не кодируйте .htaccess дабы не познать проблем



Посты по теме:

Что за файлы ZbThumbnail.info?
Переиндексация в 1С
Программа для рекурсивного поиска и замены текста в файлах - скачать!
Как включить скрытые файлы в Windows 7?
Как посчитать количество файлов в папке FreeBSD?

22 Comments

Анатолий
Июл 17, 2010 at 6:34

Здравствуйте,
ссылки устарели у Вас,а мне нужно перекодировать закладки из IE в FireFox -то есть там кодировка 1251 , а тамUTF-8 ….может я неправильно делаю импорт в Мазилу?
Закладки не читаемы,в гугле тоже много всего,но нет конкретики…
спасибо за прочтение.


 
Antonio
Июл 20, 2010 at 10:32

Анатолий, спасибо за ваш комментарий,
файлы перезакачал (действительно потерялись при переездах).

По поводу вашего вопроса странно, не должно такого быть,
обычно экспорт и импорт проходят без проблем.

Как вы делаете импорт?

Смотрите, как должно работать - в Мозилле - Закладки - Управление закладками - Импорт и резервирование - Импорт из HTML - Microsoft Internet Explorer

Это при условии что в IE у вас сейчас они есть, если же их там нет, можно попробовать импортировать в IE, а потом как я написал выше.


 
Айгор
Окт 10, 2010 at 12:45

Пробовал не работает ((( после заливки на сайт пустая страница


 
Antonio
Окт 11, 2010 at 1:20

BOM убирали в UTF?
и нужно смотреть на ошибки в логах, чтобы понять в чем дело


 
веб кодер
Дек 2, 2010 at 21:12

Почему после использования Вашей утилиты кодировка файлов меняется обратно на ANSI ? :)


 
Antonio
Дек 3, 2010 at 0:37

не знаю что вы делали, но у меня работало так как нужно


 
Евгений
Дек 23, 2010 at 13:47

Спасибо. Все работает. Скорость перекодировки впечатляет!


 
Antonio
Дек 23, 2010 at 23:50

=)


 
Борис
Янв 3, 2011 at 1:19

А ещё есть “Штирлиц” Тоже мощный редактор с множеством кодировок


 
Antonio
Янв 4, 2011 at 0:45

Штирлица знаю, пробовал и его,
возможно забыл его написать, но это классика его и так знают :-).
но вот эта связка порвала все остальные программы ;)


 
Alex
Янв 5, 2011 at 21:13

> но вот эта связка порвала все остальные программы
совершенно с вами согласен! отлично работает связка! спасибо!


 
Antonio
Янв 6, 2011 at 2:05

*THUMBS UP*
пожалуйста!


 
Designaero
Фев 18, 2011 at 20:08

после полной перекодировки всего сайта в панели управления - одни кракозяблы, по содержанию сайта - все ок, но css не работает.


 
D@nilYcH
Май 25, 2011 at 23:14

Спасиб =) о


 
Павел
Июл 11, 2011 at 20:38

Спасиба ! ;)


 
ifitows
Июл 14, 2011 at 8:30

Antonio, благодарю за представленный материал. Действительно, очень простой и удобный инструмент.


 
Юрий
Сен 7, 2011 at 14:29

Большое спасибо за информацию. Всё выручило, всё помогло. *BRAVO*


 
Antonio
Сен 7, 2011 at 22:55

*YAHOO* *THUMBS UP*
рад что помог


 
Сергей
Сен 16, 2011 at 15:47

Кстати utfcast в версии 1.5 тоже может записывать без BOM и даже про рекурсию было написано, но мне это не нужно.
Спасибо за обзор.


 
Петр
Дек 31, 2011 at 10:18

Уважаемый, скажите пожалуйста что вы посоветуете мне для пакетной перекодировки наоборот , из UTF-8 в WINDOWS-1251 ? Страниц более 4 тыс .
Спасибо.


 
Antonio
Янв 22, 2012 at 13:46

Петр, то что удалось найти (не считая разные методы рекурсивного использования iconv)

отличная программа - призер конкурсов, очень много возможностей (даже слишком много как мне показалось.. :-) )

TextPipe - единственный недостаток она платная, но в триальном режиме вроде бы позволяет сделать то что нужно.


 
Петр
Фев 6, 2012 at 18:54

Спасибо, пока испытал “iconv”, результатом доволен, за исключением малопонятного не синтаксиса.
Рекомендуемую вами программу “TextPipe” скачал, разбираюсь, там действительно настолько много всего. что трудно понять простому , требует изучения.


 

Написать

Понравилась статья? Поддержим ее голосом!
Tags: , ,

Подтвердите, что Вы не бот — выберите человечка с поднятой рукой:

Рейтинг блогов
Копирование информации с сайта возможно только с указанием прямой ссылки - http://nemcd.com (не закрытой тэгами nofollow и noindex)