А как вы себе это представляете? Вот пример: MESSERSCHMITT BF 109 G-10 он есть у нескольких производителей у Revell это 03958 у Trumpeter это 02298.При этом в одном магазине он называется вот так - Истребитель Мессершмитт Bf.109 G-10 в другом - Самолет Messerschmitt Bf 109 G-10. Но это не самое страшное, в третьем магазине получаем вот такое - Истребитель Messerschmitt Bf109 G-10 Erla, при этом (Erla) во-первых просто могут не написать, во-вторых написать но на русском, это мы еще рассматриваем ситуацию, что производитель указан.
Видимо я сильно со своей колокольни смотрю.
Мне поисковик интересен для поиска наиболее низкой цены товара, артикул и производителя которого я знаю. Т.е. я буду искать не Мессершмидт БФ109 Г10, а конкретно Revell 03958. И мне надо, чтоб сайт мне корректно смог их найти.
Может я ошибаюсь, но мне кажется большинство моделистов будут его использовать именно так.
Цитатаmika_di ()
Нет, так делать не надо. И вот почему, например у нас парсятся одновременно 5 магазинов, нагрузка на сервак уже некислая примерно 80-90%, и тут мы делаем следующее берем например название, дальше нам нужно будет выяснить сколько в нем слов а потом в цикле бежать и замерять длинну каждого слова и пересоставлять всю строчку но уже с вычищенными точками и тирешками тем временем сервер ушел в 100% и начал тормозить не только парсинг но и поиск при этом если в названии вот такая штука BF 109 G-10 ничего толкового мы не получим.
Мне видится все проще, надо хранить два варианта названия "чистовой" для вывода на сайте (Истребитель Мессершмидт БФ.109 Г-10) и вариант для поиска (истребительмессершмидтбф109г10) - это для сервера не должно быть накладно, пользовательский ввод приводить ко второму варианту и искать по вхождению в варианте для поиска. Вообще поиск это очень сложная штука. Большинство магазинов не могут сделать нормальный поиск у себя на сайте, из-за этого теряют продажи, т.к. пользователи просто не находят что ищут. Если вы сумеете сделать хороший поиск за них - то тут уже можно будет просить от них предоставлять информацию о товарах в удобной вам форме, а не парсить ее самому. Но не факт, что владельцы магазинов понимают, сколько они теряют из-за кривого поиска на сайте.
Мне видится все проще, надо хранить два варианта названия "чистовой" для вывода на сайте (Истребитель Мессершмидт БФ.109 Г-10) и вариант для поиска(истребительмессершмидтбф109г10)
Ну чтож, давайте попробуем. Глядишь может ситуация и правда лучше будет
Хозяин - барин. Наше дело предложить... Однако я бы все-таки предложил не путать вопросы алгоритма поиска с вопросами производительности. Ничего не мешает производить обработку асинхронно и вообще хранить оба варианта. В общем, вопрос в политической целесообразности. Техническое решение всегда можно найти при желании... С уважением, Евгений.
Я просто не знаю как в таких условиях можно асинхронно делать.
Проходить по базе отдельным процессом (как вариант) и помечать уже обработанные записи признаком. Но я не думаю, что нагрузка будет на столько велика, что стоит заморачиваться. С уважением, Евгений.
Попробовал набрать в поиске 38(t), галочка производителя Dragon не работает. Перечень как был так и остается. Что то не так? "Вот только этого и не хватало, нашему славному гвардейскому экипажу..." Сержант Домешек, (На войне как на войне).
Десять экранов производителей конечно внушает... Когда добавится еще 10 экранов магазинов будет еще эпичнее.. Именно про это я и говорил, когда предлагал по ним поиск делать... А выбор масштаба теперь специально убран или временные технические неполадки? С уважением, Евгений.
Сообщение отредактировал JohniGo - Четверг, 12.12.2019, 18:32
Нет нет не беспокойтесь, уже делаю и кнопку показать еще. и поле ввода для прооизводителей, чтоб по начальным буквам подставлялись. Это сегодня авария случилась, пришлось данные с песка выложить, чтоб хоть что-то работало.