Поиск похожих строк.

Программирование на sh, быть может немного про альтернативные языки
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Аватара пользователя
J.Korvin
сержант
Сообщения: 232
Зарегистрирован: 2008-11-22 12:03:41

Поиск похожих строк.

Непрочитанное сообщение J.Korvin » 2013-03-27 8:54:34

Здравствуйте, подскажите пожалуйста как можно организовать поиск по файлу и удалить строки которые повторяющийся но не целиком а только выше стоящий домен. Например файл состоит из таки строк

Код: Выделить всё

18plus-portaal.2link.be
2link.be
google.com
mail.google.com
Нужно на выходе получить

Код: Выделить всё

2link.be
google.com
Спасибо
Эсли ты с ножом значит ты с мясом.

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
liet
мл. сержант
Сообщения: 78
Зарегистрирован: 2012-01-04 13:47:43
Откуда: UA, Kiev
Контактная информация:

Re: Поиск похожих строк.

Непрочитанное сообщение liet » 2013-03-27 11:54:11

а если поиграться с чем-то типа php-шного split($str,-10) ?
выделять с конца точку и на основании этой точки отрезать домен. потом после этого смотреть какого он может быть уровня. геморно по идее выйдет. но таки вариант.
xxx: Иногда лучше сказать: "Я не знаю", чем пытаться что-то донести до дурака.

kpp
лейтенант
Сообщения: 613
Зарегистрирован: 2009-08-05 16:10:46
Откуда: Украина Днепропетровск-Киев
Контактная информация:

Re: Поиск похожих строк.

Непрочитанное сообщение kpp » 2013-03-27 12:09:44

Код: Выделить всё

sed 's/\(.*[^\.]*\.\)\([^\.]*\..*\)$/\2/'  "ИМЯ_ФАЙЛА" | sort -u
Нет, ребята, я не гордый. Не загадывая вдаль, так скажу: зачем мне орден? Я согласен на медаль.

Аватара пользователя
J.Korvin
сержант
Сообщения: 232
Зарегистрирован: 2008-11-22 12:03:41

Re: Поиск похожих строк.

Непрочитанное сообщение J.Korvin » 2013-03-27 17:21:14

kpp писал(а):

Код: Выделить всё

sed 's/\(.*[^\.]*\.\)\([^\.]*\..*\)$/\2/'  "ИМЯ_ФАЙЛА" | sort -u
Да вроде получилось. Потестирую не обрезает ли лишнего. Спасибо :smile:
Эсли ты с ножом значит ты с мясом.