
Talks #10: Vector search
Agenda
Marcin Antas: A deep dive into Vector DBs, LLMs, AI models and quantization techniques
Krzysztof Hasiński: Image Vector Search - finding unlabeled images at scale
Quiz z nagrodami
Ogłoszenia uczestników (w trakcie zapisów do quizu)
Pizza i networking
Gdzie: Poznań, CW6, Centrum Wykładowe PP, Piotrowo 2
Sponsor: Pearson
Partner: Politechnika Poznańska
-----------------------------
Marcin Antas: A deep dive into Vector DBs, LLMs, AI models and quantization techniques
Abstract:
Jak techniki kwantyzacji mogą usprawnić twoje wyszukiwanie wektorowe? Czy zastanawiałeś się kiedyś, dlaczego niektóre technologie mają tak skomplikowane nazwy, jak ColBERT, GLiNER czy ColPali? Co kryje się za tymi nazwami? Podczas tego wystąpienia poznasz odpowiedzi na te pytania i dowiesz się, jak wspomniane techniki mogą ulepszyć twoje wyszukiwanie wektorowe. Przejdziemy przez najciekawsze publikacje dotyczące kwantyzacji i przedstawimy praktyczne zastosowania. Dołącz do nas, jeśli chcesz dowiedzieć się więcej o RoFormerze, GLiNERze, ColPali, late interaction oraz late chunking.
Bio:
Weaviate Core Engineer. Full stack developer z ponad 10-letnim doświadczeniem w tworzeniu komercyjnych produktów i systemów z wykorzystaniem szerokiego zakresu technologii webowych opartych na Javie. Specjalizuje się w Liferay Portal, Hibernate, projektowaniu baz danych oraz frameworku Spring. Skupia się na dostarczaniu wysokiej jakości, łatwego w utrzymaniu kodu. Cechuje go doskonałe myślenie analityczne oraz umiejętność rozwiązywania złożonych problemów. Ma również doświadczenie w konfiguracji środowisk, automatyzacji wdrożeń, tworzeniu klastrów oraz diagnozowaniu i rozwiązywaniu problemów związanych z konfiguracją.
-----------------------------
Krzysztof Hasiński: Image Vector Search - finding unlabeled images at scale
Abstract:
Nie każde wyszukiwanie wektorowe wymaga użycia LLMa. Wykorzystywanie embeddingów do znajdowania i filtrowania nieolabelowanych danych ma wiele zastosowań. Ten wykład skupi się na szczegółach implementacji wyszukiwania wektorowego multimediów na całkiem dużą skalę (dziesiątki milionów elementów).
Bio:
Programista od siódmego roku życia i były badacz na Uniwersytecie Kalifornijskim w Davis. Głównie zainteresowany optymalizacją wydajności aplikacji, choć ostatnio zajmuję się bazami danych wektorowych oraz pipeline'ami AI/ML.
Zobacz meetup.com/poznanski-horyzont-danych/events/307790101/
- Wydarzenie bez barier: brak informacji