Страница 1 из 1

Помощь по парсингу txt

Добавлено: 2013-06-28 9:04:20
bagas
Утро доброе.
Помоги разобраться как мне сделать такое.
Парсинг xls.
# xls2csv -q 0 /mnt/share/Обработанные_списки/2013-06-27/реестр№23от27июня.xls
Выходит три страници.
мне нужно из них определенный кусок, начинается он на:

Код: Выделить всё

,,
^L30117613660371050010,Иванов Иван Иванович,,,,,,,,,,,,
И так куча строк с сотрудниками.
30117613660371050010,Иванов Иван Иванович,,,,,,,,,,,,
30117613660371050010,Иванов Иван Иванович,9629,97,,,,,,,,,,,
30117613660371050010,Иванов Иван Иванович,34552,2,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
,,,,,,,,,,,
^L
Заканчивается.
Конечно строк у этого куска все время разное.
Подскажите как лучше и практичнее выдернуть этот кусок.?

Re: Помощь по парсингу txt

Добавлено: 2013-06-28 10:13:30
bagas
Такс разобрался с поставленной задачей сам.
# xls2csv -q 0 /mnt/share/Обработанные_списки/2013-06-27/реестр№23от27июня.xls | sed '0,/^L/d; /^,,,,,,,,,,,/q' | grep ",,," | sed 's/,,,,,,,,,,,$//' | sed '$d' | sed 's/\(.*\...\).*/\1/' | uniq -u | sed 's/\ \{1,\},/,/g; s/\([0-9]\{1,\}\),\([0-9]\{1\}\)/\1.\2/'
получим такую картину

Код: Выделить всё

30117613660371050010,Иванов Иван Иванович,
30117613660371050010,Иванов Иван Иванович,
30117613660371050010,Иванов Иван Иванович,9629,97
30117613660371050010,Иванов Иван Иванович,34552,2