Поисковик моделей по интернет-магазинам
|
|
Sexton | Дата: Среда, 11.12.2019, 15:34 | Сообщение # 76 |
Сержант
Группа: Пользователи
Сообщений: 242
Репутация: 6
Статус: Оффлайн
| Цитата mika_di ( ) А как вы себе это представляете? Вот пример: MESSERSCHMITT BF 109 G-10 он есть у нескольких производителей у Revell это 03958 у Trumpeter это 02298.При этом в одном магазине он называется вот так - Истребитель Мессершмитт Bf.109 G-10 в другом - Самолет Messerschmitt Bf 109 G-10. Но это не самое страшное, в третьем магазине получаем вот такое - Истребитель Messerschmitt Bf109 G-10 Erla, при этом (Erla) во-первых просто могут не написать, во-вторых написать но на русском, это мы еще рассматриваем ситуацию, что производитель указан. Видимо я сильно со своей колокольни смотрю.
Мне поисковик интересен для поиска наиболее низкой цены товара, артикул и производителя которого я знаю. Т.е. я буду искать не Мессершмидт БФ109 Г10, а конкретно Revell 03958. И мне надо, чтоб сайт мне корректно смог их найти.
Может я ошибаюсь, но мне кажется большинство моделистов будут его использовать именно так.
Цитата mika_di ( ) Нет, так делать не надо. И вот почему, например у нас парсятся одновременно 5 магазинов, нагрузка на сервак уже некислая примерно 80-90%, и тут мы делаем следующее берем например название, дальше нам нужно будет выяснить сколько в нем слов а потом в цикле бежать и замерять длинну каждого слова и пересоставлять всю строчку но уже с вычищенными точками и тирешками тем временем сервер ушел в 100% и начал тормозить не только парсинг но и поиск при этом если в названии вот такая штука BF 109 G-10 ничего толкового мы не получим. Мне видится все проще, надо хранить два варианта названия "чистовой" для вывода на сайте (Истребитель Мессершмидт БФ.109 Г-10) и вариант для поиска (истребительмессершмидтбф109г10) - это для сервера не должно быть накладно, пользовательский ввод приводить ко второму варианту и искать по вхождению в варианте для поиска. Вообще поиск это очень сложная штука. Большинство магазинов не могут сделать нормальный поиск у себя на сайте, из-за этого теряют продажи, т.к. пользователи просто не находят что ищут. Если вы сумеете сделать хороший поиск за них - то тут уже можно будет просить от них предоставлять информацию о товарах в удобной вам форме, а не парсить ее самому. Но не факт, что владельцы магазинов понимают, сколько они теряют из-за кривого поиска на сайте.
|
|
| |
mika_di | Дата: Среда, 11.12.2019, 15:40 | Сообщение # 77 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Цитата Sexton ( ) Мне видится все проще, надо хранить два варианта названия "чистовой" для вывода на сайте (Истребитель Мессершмидт БФ.109 Г-10) и вариант для поиска(истребительмессершмидтбф109г10) Ну чтож, давайте попробуем. Глядишь может ситуация и правда лучше будет
|
|
| |
JohniGo | Дата: Среда, 11.12.2019, 17:02 | Сообщение # 78 |
Лейтенант
Группа: Участники
Сообщений: 541
Репутация: 6
Статус: Оффлайн
| Хозяин - барин. Наше дело предложить... Однако я бы все-таки предложил не путать вопросы алгоритма поиска с вопросами производительности. Ничего не мешает производить обработку асинхронно и вообще хранить оба варианта. В общем, вопрос в политической целесообразности. Техническое решение всегда можно найти при желании...
С уважением, Евгений.
|
|
| |
mika_di | Дата: Среда, 11.12.2019, 19:57 | Сообщение # 79 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Цитата JohniGo ( ) Наше дело предложить Ну собственно я для этого и обратился, и роководствуюсь пожеланиями общественности) А
Цитата JohniGo ( ) Ничего не мешает производить обработку асинхронно А это как? Я просто не знаю как в таких условиях можно асинхронно делать.
Сейчас напишу функцию, которая будет все ненужные символы вычищать. посмотрим, что получится.
|
|
| |
Пайпер | Дата: Среда, 11.12.2019, 20:47 | Сообщение # 80 |
Ген. Секретарь ООН
Группа: Администраторы
Сообщений: 6440
Репутация: 382
Статус: Оффлайн
| Цитата Sexton ( ) буду искать не Мессершмидт БФ109 Г10, а конкретно Revell 03958 +1
Don`t war, make kits ;)
|
|
| |
JohniGo | Дата: Среда, 11.12.2019, 21:48 | Сообщение # 81 |
Лейтенант
Группа: Участники
Сообщений: 541
Репутация: 6
Статус: Оффлайн
| Цитата mika_di ( ) Я просто не знаю как в таких условиях можно асинхронно делать.
Проходить по базе отдельным процессом (как вариант) и помечать уже обработанные записи признаком. Но я не думаю, что нагрузка будет на столько велика, что стоит заморачиваться.
С уважением, Евгений.
|
|
| |
mika_di | Дата: Среда, 11.12.2019, 22:01 | Сообщение # 82 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Цитата JohniGo ( ) Проходить по базе отдельным процессом (как вариант) и помечать уже обработанные записи признаком. Ааа, так это уже делается. так находится производитель и масштаб
|
|
| |
mika_di | Дата: Четверг, 12.12.2019, 10:07 | Сообщение # 83 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Ребят, подкрутил поиск, попробуйте поискать. Попутно начал собирать артикулы производителей буду пробовать увязать с товарами
|
|
| |
mika_di | Дата: Четверг, 12.12.2019, 10:29 | Сообщение # 84 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Ой, что-то пошло не так. походу я поиск отломил(((
|
|
| |
JohniGo | Дата: Четверг, 12.12.2019, 15:38 | Сообщение # 85 |
Лейтенант
Группа: Участники
Сообщений: 541
Репутация: 6
Статус: Оффлайн
| mika_di, бывает. Как говорится семь раз проверь один раз закоммить...
С уважением, Евгений.
|
|
| |
mika_di | Дата: Четверг, 12.12.2019, 16:43 | Сообщение # 86 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Сейчас вроде норм :/
|
|
| |
Hart | Дата: Четверг, 12.12.2019, 17:03 | Сообщение # 87 |
Генерал-лейтенант
Группа: Мастера
Сообщений: 8540
Репутация: 594
Статус: Оффлайн
| Попробовал набрать в поиске 38(t), галочка производителя Dragon не работает. Перечень как был так и остается. Что то не так?
"Вот только этого и не хватало, нашему славному гвардейскому экипажу..." Сержант Домешек, (На войне как на войне).
|
|
| |
JohniGo | Дата: Четверг, 12.12.2019, 17:19 | Сообщение # 88 |
Лейтенант
Группа: Участники
Сообщений: 541
Репутация: 6
Статус: Оффлайн
| Десять экранов производителей конечно внушает... Когда добавится еще 10 экранов магазинов будет еще эпичнее.. Именно про это я и говорил, когда предлагал по ним поиск делать... А выбор масштаба теперь специально убран или временные технические неполадки?
С уважением, Евгений.
Сообщение отредактировал JohniGo - Четверг, 12.12.2019, 18:32 |
|
| |
Varyag | Дата: Четверг, 12.12.2019, 17:34 | Сообщение # 89 |
Лейтенант
Группа: Участники
Сообщений: 756
Репутация: 112
Статус: Оффлайн
| Присоединяюсь к мнению уважаемых коллег что название фирмы в оргинале и артикул или его номерная часть наиболее эффективные поисковые признаки.
|
|
| |
mika_di | Дата: Четверг, 12.12.2019, 20:49 | Сообщение # 90 |
Сержант
Группа: Пользователи
Сообщений: 107
Репутация: 23
Статус: Оффлайн
| Цитата JohniGo ( ) Десять экранов производителей конечно внушает... Нет нет не беспокойтесь, уже делаю и кнопку показать еще. и поле ввода для прооизводителей, чтоб по начальным буквам подставлялись. Это сегодня авария случилась, пришлось данные с песка выложить, чтоб хоть что-то работало.
|
|
| |