Dostala jsem dataset 17tis specializovaných SEO vyhledávání, tak jsem ho natrénovala společně s embeding LLM semantickým modelem do jednoho vektorového modelu, který používám na kvantové věci. Pak jsem vzala 50tis produktů z DB a vygenerovala k nim sémanticky tři vektorově nejvhodnější vyhledávací termíny z google a seznamu pro našeptávač produktovému managerovi pro úpravu SEO, co se nejvíc vyhledávalo a aby nemusel hledat slovní spojení v excelu, tak toto za něj vyřeší model a jemu se zobrazí jako další sloupce v ERP systému Helios, ale dá se použít jakýkoliv. Kód trénování a zpracování v odkazu. Funguje jako pipeline, která zpracuje a uloží do databáze tisíce dotazů.

Kód je zde a model není součástí.
train_dataset_SEO/train_seo.py at main · bluemoondom/train_dataset_SEO