Страница 1 из 1

Поиск похожих строк.

Добавлено: 2013-03-27 8:54:34
J.Korvin
Здравствуйте, подскажите пожалуйста как можно организовать поиск по файлу и удалить строки которые повторяющийся но не целиком а только выше стоящий домен. Например файл состоит из таки строк

Код: Выделить всё

18plus-portaal.2link.be
2link.be
google.com
mail.google.com
Нужно на выходе получить

Код: Выделить всё

2link.be
google.com
Спасибо

Re: Поиск похожих строк.

Добавлено: 2013-03-27 11:54:11
liet
а если поиграться с чем-то типа php-шного split($str,-10) ?
выделять с конца точку и на основании этой точки отрезать домен. потом после этого смотреть какого он может быть уровня. геморно по идее выйдет. но таки вариант.

Re: Поиск похожих строк.

Добавлено: 2013-03-27 12:09:44
kpp

Код: Выделить всё

sed 's/\(.*[^\.]*\.\)\([^\.]*\..*\)$/\2/'  "ИМЯ_ФАЙЛА" | sort -u

Re: Поиск похожих строк.

Добавлено: 2013-03-27 17:21:14
J.Korvin
kpp писал(а):

Код: Выделить всё

sed 's/\(.*[^\.]*\.\)\([^\.]*\..*\)$/\2/'  "ИМЯ_ФАЙЛА" | sort -u
Да вроде получилось. Потестирую не обрезает ли лишнего. Спасибо :smile: