forum.lissyara.su

Добавлено: **2013-06-28 9:04:20**

Утро доброе.
Помоги разобраться как мне сделать такое.
Парсинг xls.
# xls2csv -q 0 /mnt/share/Обработанные_списки/2013-06-27/реестр№23от27июня.xls
Выходит три страници.
мне нужно из них определенный кусок, начинается он на:

Код: Выделить всё

,,
^L30117613660371050010,Иванов Иван Иванович,,,,,,,,,,,,
И так куча строк с сотрудниками.
30117613660371050010,Иванов Иван Иванович,,,,,,,,,,,,
30117613660371050010,Иванов Иван Иванович,9629,97,,,,,,,,,,,
30117613660371050010,Иванов Иван Иванович,34552,2,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
^L

Заканчивается.
Конечно строк у этого куска все время разное.
Подскажите как лучше и практичнее выдернуть этот кусок.?

Добавлено: **2013-06-28 10:13:30**

Такс разобрался с поставленной задачей сам.
# xls2csv -q 0 /mnt/share/Обработанные_списки/2013-06-27/реестр№23от27июня.xls | sed '0,/^L/d; /^,,,,,,,,,,,/q' | grep ",,," | sed 's/,,,,,,,,,,,$//' | sed '$d' | sed 's/$.*\...$.*/\1/' | uniq -u | sed 's/\ \{1,\},/,/g; s/$[0-9]\{1,\}$,$[0-9]\{1\}$/\1.\2/'
получим такую картину

Код: Выделить всё

30117613660371050010,Иванов Иван Иванович,
30117613660371050010,Иванов Иван Иванович,
30117613660371050010,Иванов Иван Иванович,9629,97
30117613660371050010,Иванов Иван Иванович,34552,2

forum.lissyara.su

Помощь по парсингу txt

Помощь по парсингу txt

Re: Помощь по парсингу txt