Страница 1 из 1

Кодировки тудысь их.

Добавлено: 2011-08-10 15:21:59
Matveev
Есть сервер №1

Код: Выделить всё

% uname -v
FreeBSD 7.1-RELEASE #0: Sun Apr 19 19:26:05 YEKST 2009 
На нём установлено специализированное ПО (сторонняя разработка).
Пользователи, работая через виндового клиента, прикрепляют в систему файлы (пример: Новый текстовый документ -001.doc) которые в дальнейшем складируются в одном месте на фре в виде:

Код: Выделить всё

%cd folder/
%ls -la
-rwxr-xr-x  1 avraam  wheel    64512 Apr 29  2010 24773#64#????????#46#doc
-rwxr-xr-x  1 avraam  wheel    60928 Apr 29  2010 24773#64#????????????#32#??????#32#548#46#xls
-rwxr-xr-x  1 avraam  wheel    25600 Apr 29  2010 24773#64#????????????#46#doc
-rwxr-xr-x  1 avraam  wheel    57856 Apr 29  2010 24788#64#549#32##1050#???????????#32#??????#46#xls
-rwxr-xr-x  1 avraam  wheel    51200 Apr 29  2010 24788#64#549#32##1055#?????????#32#1#46#doc
-rwxr-xr-x  1 avraam  wheel    66048 Apr 29  2010 24788#64#549#32#??????#32#????????#32#?#46#doc
-rwxr-xr-x  1 avraam  wheel    64512 Apr 29  2010 24791#64#????????#46#doc
-rwxr-xr-x  1 avraam  wheel    59904 Apr 29  2010 24791#64#????????????#32#??????#32#550#46#xls
-rwxr-xr-x  1 avraam  wheel    49664 Apr 29  2010 24791#64#????????????#46#xls
%

Данные файлы архивируются под рутом

Код: Выделить всё

tar -czf folder.tar.gz folder/
при локализации:

Код: Выделить всё

serv# locale
LANG=
LC_CTYPE="C"
LC_COLLATE="C"
LC_TIME="C"
LC_NUMERIC="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_ALL=
Далее данный архив перенаправляется на Сервер №2 (есть свои причины такого поступка)

Код: Выделить всё

%uname -v
FreeBSD 8.2-RELEASE #0: Thu Feb 17 02:41:51 UTC 2011  
Где распаковывается

Код: Выделить всё

tar xczf folder.tar.gz 
На №2 проведена русификация консоли на UTF-8 (http://noted.org.ua/1982)

Код: Выделить всё

%locale
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_ALL=
P.S.: Данное ПО на винде (если хранилище на винде) переименовывает файл по своим собственным соображениям

Код: Выделить всё

Новый текстовый документ -001.doc
на

Код: Выделить всё

110749#64##1053#овый#32#текстовый#32#документ#32#-001#46#doc

Требуется данные вопросы переименовать ? на рус буквы на Сервере №2.
convmv эти файлы не видит

Код: Выделить всё

%cd DAY_20090422
%ls -la
total 52
drwxr-xr-x  2 avraam  avraam    512  4 авг  2010 .
drwxr-xr-x  7 avraam  avraam    512 10 авг 17:14 ..
-rw-r--r--  1 avraam  avraam  48640 22 апр  2009 2572#64##1052#????????????#32#????????#46#doc
%convmv -r -f cp1251 -t utf-8 2572#64##1052#\?\?\?\?\?\?\?\?\?\?\?\?#32#\?\?\?\?\?\?\?\?#46#doc
Starting a dry run without changes...
No changes to your files done. Use --notest to finally rename the files.
%
Посоветовали сделать как описано на (http://silverghost.org.ua/2009/03/26/op ... ogo-fajla/)

Код: Выделить всё

%ls -1 | head -1 | iconv -f CP1251 -t utf-8
2572#64##1052#????????????#32#????????#46#doc
%ls -1 | head -1 | iconv -f koi8-r -t utf-8
2572#64##1052#????????????#32#????????#46#doc
%
Я уже отчаялся помогите пожалуйста.

Re: Кодировки тудысь их.

Добавлено: 2011-08-10 15:32:08
Matveev
на Сервере №1

Код: Выделить всё

serv# /usr/local/bin/convmv -r -f cp1251 -t utf-8 2572#64##1052#\?\?\?\?\?\?\?\?\?\?\?\?#32#\?\?\?\?\?\?\?\?#46#doc
Starting a dry run without changes...
No changes to your files done. Use --notest to finally rename the files.
serv# ls -1 | head -1 | iconv -f CP1251 -t utf-8
2572#64##1052#????????????#32#????????#46#doc
serv# ls -1 | head -1 | iconv -f koi8-r -t utf-8
2572#64##1052#????????????#32#????????#46#doc

Re: Кодировки тудысь их.

Добавлено: 2011-08-10 16:20:11
bagas
лакализуйте первый сервер...

Re: Кодировки тудысь их.

Добавлено: 2011-08-11 5:47:27
Matveev
Пробовал локализацию №1 на CP1251 и utf-8. В патти при логировании соответственно менял транслит. Вопросы остались.

Как вообще узнать в какой они там кодировке?

Re: Кодировки тудысь их.

Добавлено: 2011-08-11 7:38:49
bagas
кто они?
кодировку делай сделай везде одинаковую, а то у тебя стоит на одном английская , а на другом русская...неправильно как то.
у меня к примеру на файловых серверах стоит кодировка cp1251 и все нормально...

Re: Кодировки тудысь их.

Добавлено: 2011-08-14 12:18:37
Raven2000