Проверить совпадения в названии домена, но не в полном урл

Тема в разделе "Регулярные выражения", создана пользователем zek24, 18 сен 2018.

  1. zek24

    zek24

    Moderator
    Регистр.:
    14 ноя 2009
    Сообщения:
    799
    Симпатии:
    280
    Смысл такой
    есть массив строк типа

    https://de-de.site.com/about/find.com
    http://find.com/about/
    https://m.youtube.com/user/find.com/playlists
    find.com
    zium.co/find.com
    find.com/sefkdstaddza.info
    s.find.com/szcgzdfgefgolyd.php?id=site.com
    www.winsolfudtgions.info/detail.asp?id=find.com
    www.find.com/detail.asp?id=4913629
    https://www.find.comfilm/916603/video/142959/
    de82a.find.com/anilingus/sasaekss-tasza.php

    Нужна регулярка, которая сможет отделить те строки, где find.com - имя домена, а не просто встречается в урл.

    То есть подходят:

    https://find.com/about/
    find.com
    find.com/sefkdstaddza.info
    s.find.com/szcgzdfgefgolyd.php?id=site.com
    www.find.com/detail.asp?id=4913629
    de82a.find.com/anilingus/sasaekss-tasza.php

    Не подходят

    https://m.youtube.com/user/find.com/playlists
    https://de-de.site.com/about/find.com
    zium.co/find.com
    https://www.find.comfilm/916603/video/142959/
    www.winsolfudtgions.info/detail.asp?id=find.com
     
    Последнее редактирование: 18 сен 2018
  2. Sorcus

    Sorcus Sorcus. A New Beginning.

    Moderator
    Регистр.:
    10 июл 2011
    Сообщения:
    426
    Симпатии:
    783
    zek24 нравится это.
  3. zek24

    zek24

    Moderator
    Регистр.:
    14 ноя 2009
    Сообщения:
    799
    Симпатии:
    280
    Да, скорее всего не подходит.
    Исправил.
     
  4. Sorcus

    Sorcus Sorcus. A New Beginning.

    Moderator
    Регистр.:
    10 июл 2011
    Сообщения:
    426
    Симпатии:
    783
    > https://www.find.comfilm/916603/video/142959/
    Битая ссылка тоже должна подпадать под правило?

    Если без битой ссылки, то может так?
    > (www|https?:\/\/|^)[^\/]{0,}find.com($|\/)
     
    zek24 нравится это.
  5. gradar

    gradar Постоялец

    Регистр.:
    15 авг 2015
    Сообщения:
    123
    Симпатии:
    74
    ^(https:\/\/)*([a-z0-9]+[.])*find[.]com([\/\?\=\-\.a-z0-9])*
     
    Sorcus и zek24 нравится это.
  6. zek24

    zek24

    Moderator
    Регистр.:
    14 ноя 2009
    Сообщения:
    799
    Симпатии:
    280
    не нашло https://find.com/about/
    но спасибо.
    https://regex101.com/r/3YE6UG/3
    Сорри, опечатка.
    Вроде работает.

    Спасибо!!
     
  7. Sorcus

    Sorcus Sorcus. A New Beginning.

    Moderator
    Регистр.:
    10 июл 2011
    Сообщения:
    426
    Симпатии:
    783
  8. gradar

    gradar Постоялец

    Регистр.:
    15 авг 2015
    Сообщения:
    123
    Симпатии:
    74
    Я на нотепаде++ проверял
     
  9. zek24

    zek24

    Moderator
    Регистр.:
    14 ноя 2009
    Сообщения:
    799
    Симпатии:
    280
    Нашел еще вариант, который находится регуляркой выше, но не является нужным результатом:
    https://regex101.com/r/3YE6UG/4

    Подозреваю, что это уже хрен исправишь, но вдруг есть идеи.
     
  10. Sorcus

    Sorcus Sorcus. A New Beginning.

    Moderator
    Регистр.:
    10 июл 2011
    Сообщения:
    426
    Симпатии:
    783
    Добавить поиск от начала строки с помощью символа "^" в начале регулярки.
    Код:
    ^(www|https?:\/\/|^)[^\/]{0,}find.com($|\/)
     
    zek24 нравится это.