Data processing in LLM RAG is very important, it helps to improve data extraction results, especially for complex layout documents, with large tables. This is why I build open source Sparrow Parse library, it helps to balance between LLM and standard Python data extraction methods.
Sparrow GitHub repo:
https://github.com/katanaml/sparrow
0:00 Sparrow Parse
1:50 Code structure
2:08 Unstructured processor
4:28 Markdown processor
6:14 HTML extactor
7:15 Summary
CONNECT:
Subscribe to this YouTube channel
Twitter: / andrejusb
LinkedIn: / andrej-baranovskij
Medium: / andrejusb
#llm #rag #python
Смотрите видео Sparrow Parse - Data Processing for LLM онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Andrej Baranovskij 19 Май 2024, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 1,279 раз и оно понравилось 26 людям.