Страница 1 из 1
Помогите по парсингу
Добавлено: 2011-12-29 16:22:49
capsmolet
Здраствуйте.
Достался мне по наследству файл вот такого вида:
есть необходимость привести его к другому виду:
Даже не знаю с чего начать.
Подскажите идеи или хотя бы направьте в нужном направлении.
Желательно на shell.
Заранее спасибо!
Re: Помогите по парсингу
Добавлено: 2011-12-29 23:32:34
kpp
Вот, нарисовал нечто похожее...
Чистый Шелл. Может можно и проще. Это первое что пришло, как говорится, в голову
Вроде работает, наверняка не универсально, но направление указано.
Ну а фенечки типа очистки временных файлов сами сделаете, если нужно
Код: Выделить всё
#!/bin/sh
#
# rejoin.sh
# 2011-12-29 22:00:17
# kohan pavel e-mail: kpp77@yandex.ru ICQ: 92819905
# Description: for comrade capsmolet ;)
# version 1
#
in_file="${1}"
out_file="${2}"
in_file="${out_file+frm.txt}"
out_file="${out_file+frm_et.txt}"
list="`grep -nE "^ {17}I [^0-9]{1,2}[1-9]{1,2} [^0-9]*.*$" "${in_file}" | sed 's/^\([0-9]*\): [^I]*I [^1-9]*\([1-9]*\).*$/\1 \2/'`"
gr=0
gr_i=0
echo "${list}" | ( while read num id
do
if [ ${id} -eq 1 ]; then
[ ${gr} -eq 0 ] || sed 's/^[ 0-9]*>\(.*\)$/\1/' "${fl_base}" > "${gr}_0"
gr_i=1
gr=`expr ${gr} + 1`
fi
if [ ${gr} -eq 1 ]; then
num=`expr ${num} - 10`
else
num=`expr ${num} + 2`
fi
if [ ${id} -eq 1 ]; then
sed -n ${num}',/^.$/{; p; /^.$/{; q; }; }' "${in_file}" | tr -d "\015" | cat -n > "${gr}_${gr_i}"
fl_base="${gr}_${gr_i}"
else
gr_i=`expr ${gr_i} + 1`
sed -n ${num}',/^.$/{; s/^\(.\{18\}\)\(.*\)$/\2/p; /^.$/{; q; }; }' "${in_file}" | tr -d "\015" | cat -n > "${gr}_${gr_i}"
join -t"<->" -o 1.1,1.2,2.2 ${fl_base} ${gr}_${gr_i} | sed 's/<--->//2' > ${i}_tmp
mv ${i}_tmp ${fl_base}
fi
done
sed 's/^[ 0-9]*<------>\(.*\)$/\1/' "${fl_base}" > "${gr}_0"
)
cat [1-9]_0 > "${out_file}"
Re: Помогите по парсингу
Добавлено: 2011-12-30 9:27:27
capsmolet
О! Большое спасибо!
Теперь хотя бы вижу в какую сторону смотреть!
Еще раз, большое спасибо!!!
Re: Помогите по парсингу
Добавлено: 2011-12-30 9:55:45
capsmolet
Подскажите пожалуйста.
Как мне извлечь две строки из файла по наименованию поля "1-й филиал", например,
Код: Выделить всё
----------------------------------------------
1-й филиал пред.: 100: 112: 50:
текущ: 150: 111: 53:
----------------------------------------------
а затем соединить ее с другой строкой с таким же названием, но убрать второе вхождение названия и убрать "пред.", "текущ", чтобы получилась одна строка
-------------------------------------------------------
1-й филиал пред.: 100: 112: 50: 1: 10: 13:
текущ: 150: 111: 53: 3: 11: 15:
-------------------------------------------------------
Заранее спасибо.
Re: Помогите по парсингу
Добавлено: 2011-12-30 12:03:01
kpp
Скрипт выше соединяет все строки филиалов.