Смена кодировки текстового файла с CP1251 на UTF8

Если при открытии текстового файла на экран выводятся крокозябы, то это говорит о том, что данный файл создан в неправильной кодировке. В моем случае этот файл был создан в Windows в его "уникальной" кодировке CP1251, а открыть его требовалось в Ubuntu с "правильной" кодировкой UTF8.

Для того, чтобы произвести смену кодировки тестового файла с CP1251 на кодировку UTF8 нам понадобится пакет enca. Все ниже описанное будет приведено для дистрибутива Ubuntu, но алгоритм действий будет работать и в других дистрибутивах.

Смена кодировки текстового файла с CP1251 на UTF8:
  1. Устанавливаем необходимый пакет:
    sudo apt-get install enca
  2. Конвертируем один файл в кодировку локали дистрибутива, которая определяется автоматически:
    enconv имя_файла

    Вместо имя_файла должен находится полный путь до файла в кодировке CP1251, к примеру: enconv /home/koder/1.txt

    Если этих файлов окажется несколько, то команда выглядит несколько иначе:

    find путь_к_директории -name "*.txt" -exec enconv {} \;
    Для нашего примера должно быть так: find /home/koder/ -name "*.txt" |enconv

Информация взята с Дневника triklozoid'a Если Вас интересуют вопросы маркетинга и рекламы, то основы маркетинга Вы можете получить бесплатно в Интернете.

Алмазная резка, бурение, сверление отверстий http://artel-msk.ru/ доверьте профессионалам.

Комментарии:

  1. Freol опубликовал комментарий 5 Май 2010, 22:11 #

    Всё-таки так будет нагляднее ИМХО + мне сказали, что ваш способ для множества файлов не сработал…

    $ find путь_к_директории -name “*.txt” -exec enconv {} \;

    | Ответить
  2. Admin опубликовал комментарий 6 Май 2010, 06:08 #

    Поправил. Самому не было необходимости в конвертировании большого количества файлов

    | Ответить
  3. Diman опубликовал комментарий 26 Ноябрь 2010, 04:22 #

    Спасибо! За Вашу, Точку зрения решения проблемы. Очень Вам признателен и Ваша статья, очень помогла мне. Спасибо. !

    | Ответить
  4. Артур опубликовал комментарий 16 Май 2011, 18:36 #

    Спасибо, ваша статья очень помогла

    | Ответить
  5. Daniel First опубликовал комментарий 14 Июль 2011, 16:44 #

    помогите расшифровать: ШдИ!Чг…рРсйт“Х4·

    | Ответить
    • Admin опубликовал комментарий 19 Июль 2011, 08:53 #

      Абракадабра какая-то

      | Ответить
  6. Daniel First опубликовал комментарий 1 Август 2011, 18:39 #

    Я один остался недоволен=/

    | Ответить
  7. Александр опубликовал комментарий 25 Апрель 2012, 14:01 #

    Пожалуйста, подскажите как в Windows 7 сменить кодировку имен файлов на UTF-8? Имена все в кириллице, перевод в транслит не уместен, нужно сменить именно кодировку. Какими средствами без Линукса это можно сделать?

    | Ответить
  8. Denis опубликовал комментарий 23 Февраль 2013, 12:12 #

    Пакетный перекоривщик текстовых файлов DeniSoft text Converter http://conv.denisoft.ru Версия для Windows. Бесплатный. Может убирать BOM-сигнатуру из файлов в кодировке UTF-8.

    | Ответить
  9. ProMan опубликовал комментарий 30 Август 2013, 21:52 #

    Поменять кодировку файла в ОС Linux – http://yournet.kz/view/590

    | Ответить
  10. Юра опубликовал комментарий 19 Февраль 2015, 09:05 #

    Супер! Я три часа сидел мучился в ручную, перекодировал файлы в UTF-8. Оставалось ещё 2/3 работы, я думал свихнусь… И О чудо, пять минут и всё готово!!! Спасибо!!!

    | Ответить
Имя
e-mail
Сайт
Текст комментария: