[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
Форум моделистов » Барахолка » Инфо о модельных магазинах » Поисковик моделей по интернет-магазинам (Бета-тест поискового серввиса)
Поисковик моделей по интернет-магазинам
JohniGoДата: Воскресенье, 08.12.2019, 19:13 | Сообщение # 61
Лейтенант
Группа: Пользователи
Сообщений: 521
Репутация: 6
Статус: Offline
А что с регистрацией и подпиской на снижение цен? Планируете реализовывать? Можно также сделать рассылки по поисковым запросам, как на Ebay. Тоже прикольная фича.

С уважением, Евгений.

 
LokiДата: Воскресенье, 08.12.2019, 20:25 | Сообщение # 62
Генерал-майор
Группа: Мастера
Сообщений: 3058
Репутация: 235
Статус: Offline
Можно что то сделать с поиском по названию? Хочу найти 109-й Месс, набиваю Me Bf109 , таких нет. Но если набить Bf109, то находятся Ревелловские модели, а Трамп свои пишет с пробелом, Bf 109. В этом случае находятся и допы и модели нескольких производителей. В общем не зная точное название можно пролететь с поиском.

Сообщение отредактировал Loki - Воскресенье, 08.12.2019, 20:26
 
mika_diДата: Вторник, 10.12.2019, 22:34 | Сообщение # 63
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата Loki ()
Можно что то сделать с поиском по названию
Попробуйте пожалуйста сейчас
 
mika_diДата: Вторник, 10.12.2019, 22:36 | Сообщение # 64
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата JohniGo ()
А что с регистрацией и подпиской на снижение цен? Планируете реализовывать?
Конечно, ну вернее регистрация как таковая наверно не нужна, просто можно будет отслеживать товары, в плане появления в продаже и изменения цены.
 
mika_diДата: Вторник, 10.12.2019, 22:48 | Сообщение # 65
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата Loki ()
В общем не зная точное название можно пролететь с поиском
По идеи сейчас должно быть норм, и с пробелами и с Me, вообще конечно это тот еще геморой, в идеале эта штука должна начать нимимать запросы вида  - 109й мессер. Но до этого ох как далеко
 
JohniGoДата: Вторник, 10.12.2019, 23:42 | Сообщение # 66
Лейтенант
Группа: Пользователи
Сообщений: 521
Репутация: 6
Статус: Offline
Цитата mika_di ()
регистрация как таковая наверно не нужна, просто можно будет отслеживать товары, в плане появления в продаже и изменения цены.
А как организовать уведомления? Руками вводить е-майл для каждого запроса? А если вбить чужой? Прежде чем что-то куда-то отсылать, неплохо бы удостовериться, что владелец ящика реально хочет получать уведомления. Не говоря про то, что нужен личный кабинет, где можно посмотреть имеющиеся подписки и при желании отредактировать их или вовсе удалить. Т.е. в любом случае нужен интерфейс для управления этими уведомлениями. И как это организовать без регистрации (с подтвердением на указанный е-майл) я затрудняюсь представить.

По поводу алгоритма поиска - точно надо думать (точнее почитать наверное что-то на эту тему). Я бы на вскидку предложил просто убирать дефисы (а может и вообще всякие служебные символы типа точек, слэшей в обе стороны и т.д.) из названи и из поисковых запросов при обработке, т.к. и названия и индексы товара магазины погут писать совершенно по-разному. Возможно имеет смысл и пробелы убирать между 1-2-3 буквенными значениями, но это точно надо бы полистать теорию или хотя-бы экспериментально проверить.


С уважением, Евгений.



Сообщение отредактировал JohniGo - Вторник, 10.12.2019, 23:49
 
mika_diДата: Среда, 11.12.2019, 09:15 | Сообщение # 67
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата JohniGo ()
Я бы на вскидку предложил просто убирать дефисы

Ну тут вообще все не просто, я приспосабливаю поисковик как раз под всевозможные варианты написания, это менее затратный подход чем вырезание или экранирование пробелов и всякого такого. Опять же имеет значение длинна поисковой фразы вот  простой  пример, Loki  написал Me bf109 а другой человек  пишет прям полностью Messerschmitt Bf.109 такое уже никак не отфильтруешь более того люди пишут и на русском (ну то есть по привычке как в гугле). Я подумал и вот чего придумал. Если у человека по его запросу не нашлось то что он хочет, дать ему кнопочку, он на нее тыкнет и скажет, хочу, чтобы  вот по такому запросу находилось вот такое ну и в течении минут 15 поисковик будет это уметь. Что-то автоматом подцепится, что-то я руками подключу посмотрев уведомления. 

Цитата JohniGo ()
А как организовать уведомления? Руками вводить е-майл для каждого запроса? А если вбить чужой?
Ну тут я только за, вопрос согласятся ли люди вообще давать свои почты на постоянное хранение. В плане отписки можно ссылку в письме сделать, ткнул на ссылку и письма приходить перестанут.
 
JohniGoДата: Среда, 11.12.2019, 13:55 | Сообщение # 68
Лейтенант
Группа: Пользователи
Сообщений: 521
Репутация: 6
Статус: Offline
Цитата mika_di ()
согласятся ли люди вообще давать свои почты на постоянное хранение.
Абсолютно стандартная практика на всех ресурсах. Рассылка писем без регистрации на мой взгляд гораздо менее предпочтительна.

А с поиском да, все очень не просто. Но хотя-бы убрать дефисы из номенклатурных номеров - уже большое дело. А то даже точно зная номер можно товар не найти. Хотя и это тоже не панацея, т.к. многие магазины добавляют префиксы производителя. А некоторые производители сами используют префиксы.


С уважением, Евгений.

 
mika_diДата: Среда, 11.12.2019, 13:58 | Сообщение # 69
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата JohniGo ()
Но хотя-бы убрать дефисы из номенклатурных номеров - уже большое дело.
А так не получится, так как это часть названия. Ну то сеть выяснить что это именно номер очень сложно.
 
mika_diДата: Среда, 11.12.2019, 14:02 | Сообщение # 70
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
я больше скажу, магазины пишут русские буквы в забугорных артикулах.
 
SextonДата: Среда, 11.12.2019, 14:18 | Сообщение # 71
Сержант
Группа: Пользователи
Сообщений: 224
Репутация: 6
Статус: Offline
Цитата mika_di ()
А так не получится, так как это часть названия. Ну то сеть выяснить что это именно номер очень сложно.

Для популярных производителей это все же реально, их префиксы известны, можно составить базу синонимов.
Плюс у многих магазинов в карточке товара есть отдельно "артикул", его спарсить и разобрать проще, чем из названия
 
mika_diДата: Среда, 11.12.2019, 14:34 | Сообщение # 72
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата Sexton ()
Плюс у многих магазинов в карточке товара есть отдельно "артикул", его спарсить и разобрать проще, чем из названия
Его даже отдельно парсить не нужно, так как он есть в названии по нему и так ищется.
Цитата Sexton ()
Для популярных производителей это все же реально, их префиксы известны, можно составить базу синонимов.
А как вы себе это представляете? Вот пример: MESSERSCHMITT BF 109 G-10 он есть у нескольких производителей у Revell это 03958 у Trumpeter  это 02298.
При этом в одном магазине он называется вот так - Истребитель Мессершмитт Bf.109 G-10 в другом - Самолет Messerschmitt Bf 109 G-10.
Но это не самое страшное, в третьем магазине получаем вот такое - Истребитель Messerschmitt Bf109 G-10 Erla, при этом (Erla) во-первых просто могут не написать, во-вторых написать но на русском, это мы еще рассматриваем ситуацию, что производитель указан.

Как вы понимаете, вариантов написать - Истребитель Мессершмитт Bf.109 G-10 огромное количество. Вариант с убиранием тирешек и точек например так Bf109 G10, а человек взял и написал Bf 109 G 10 вот и приехали, с точки зрения машины это поисковая фраза из 4 слов в то время как Bf.109 G-10 всего 2, а искать по всем словам из такой фразы сами понимаете одно только "G" чего будет стоить))))


Сообщение отредактировал mika_di - Среда, 11.12.2019, 14:42
 
JohniGoДата: Среда, 11.12.2019, 14:44 | Сообщение # 73
Лейтенант
Группа: Пользователи
Сообщений: 521
Репутация: 6
Статус: Offline
Я предлагаю в базу писать обработанный текст из которого исключать точки, и тире и пробелы между словами, если длина слова меньше 4 символов.
Тоже самое делать и с вводимым пользователем запросом.
Честно скажу - голимое имхо. Никогда задачами поиска не занимклся и не интересовался. smile

Можно пользователю дать переключатель "искать по вхождению" "искать точное совпадение" "искать любое из слов"... И сделать не сложно и пользователь сможет поиграть при желании (хотя конечно не многие будут заморачиваться)...

Вообще, алготирмы поиска и структура храниния данных самое сложное в этом проекте...


С уважением, Евгений.

 
mika_diДата: Среда, 11.12.2019, 14:44 | Сообщение # 74
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Но я чего-нибудь придумаю.
 
mika_diДата: Среда, 11.12.2019, 14:55 | Сообщение # 75
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Offline
Цитата mika_di ()
Я предлагаю в базу писать обработанный текст из которого исключать точки, и тире и пробелы между словами, если длина слова меньше 4 символов.
Нет, так делать не надо. И вот почему, например у нас парсятся одновременно 5 магазинов, нагрузка на сервак уже некислая примерно 80-90%, и тут мы делаем следующее берем например название, дальше нам нужно будет выяснить сколько в нем слов а потом в цикле бежать и замерять длинну каждого слова и пересоставлять всю строчку но уже с вычищенными точками и тирешками тем временем сервер ушел в 100% и начал тормозить не только парсинг но и поиск при этом если в названии вот такая штука BF 109 G-10  ничего толкового мы не получим.
 
Форум моделистов » Барахолка » Инфо о модельных магазинах » Поисковик моделей по интернет-магазинам (Бета-тест поискового серввиса)
Поиск:

Сайт-форум моделистов © 2020