Каждый день главному агроному стекается информация о проделанных работах на полях. Его задача - это проанализировать эту неструктурированную информацию, выделить релевантные части, а потом структурировать, заполнив excel таблицу.
Информация может быть представлена совершенно разным образом 🤔. Способ представления полностью зависит от агронома, который её присылает. Это могут быть:
- сокращения до одной буквы, обозначающей часть культуры;
- пропуски в заполнении показателей за день;
- представление целевых показателей в процентах, а не в нужных единицах измерениях;
- пропуск и операции, и культуры, если они повторяются и т.д.
🔥 Всё это вносит сложность в анализе такого рода информации, поэтому нами был разработан сервис по анализу и структуризации информации, поступающей от агрономов, который:
- ❗ не меняет текущую логику отправки сообщений агрономами;
- ❗ автоматизирует процесс сбора и структурировании инфорамции;
- ❗ предоставляет возможность автоматического запуска сервиса с сохранением результатов работы, как на локальный диск, так и на google диск;
- ❗ требует намного меньше времени для работы, чем требуется главному агроному;
- ❗ обладает точностью более 95% 🎯
Решение возможно запустить как на ОС Windows, так и на macOS / Linux.
- Откройте папку проекта 📁 и дважды кликните по install.bat 📄.
- Если Python 🐍 не установлен — откроется страница загрузки. ❗❗❗ Установите Python , затем снова запустите
install.bat❗❗❗. ⚠️ Все необходимые компоненты (Poetry, зависимости) установятся автоматически, окружение будет создано.
- Если Python 🐍 не установлен — откроется страница загрузки. ❗❗❗ Установите Python , затем снова запустите
▶️ Для запуска приложения дважды кликните по start.bat 📄.- ❗ Далее необходимо перейти в раздел "⚙️ Настройки", где задать API ключи для работы с языковой моделью, а также название чата для парсинга
- Откройте терминал в папке проекта и выполните ⌨️:
./install.sh
- ❗❗❗ Если скрипт не запускается, дайте права:
chmod +x install.sh❗❗❗ ⚠️ Poetry и зависимости установятся автоматически, окружение будет создано.
- ❗❗❗ Если скрипт не запускается, дайте права:
▶️ Для запуска приложения выполните ⌨️:./start.sh
- ❗ Далее необходимо перейти в раздел "⚙️ Настройки", где задать API ключи для работы с языковой моделью, а также название чата для парсинга
- 🧑💻 Для ручного создания отчёта перейдите на вкладку 📝 Ручной отчёт, выберите дату и нажмите "Запустить анализ". Готовый Excel-файл 📄 можно скачать сразу из приложения.
- ⚙️ Для автоматического создания отчётов перейдите на вкладку ⏰ Автоматизация:
- Выберите удобное время (часы и минуты).
- Нажмите "Включить автозапуск" — задача появится в планировщике Windows.
- В указанное время отчёт будет создаваться автоматически.
- 📊 Для просмотра графиков по отчётам используйте вкладку 📊 Визуализация.
- 📝 Все отчёты сохраняются в папку data/ внутри проекта.
- Для работы парсера необходим установленный Google Chrome.
- Не выключайте компьютер и не закрывайте браузер с авторизованным WhatsApp Web, если хотите, чтобы автозапуск работал корректно.
📁 AgroLLM_Hack
├─📁 app (папка с основными скриптами - запуск приложения, автозапуск)
│ ├─📄 auto_report.py
│ └─📄 run_auto_report.bat
│ └─📄 run_auto_report.sh
│ └─📄 streamlit_app.py
├─📁 assets (папка со статическими элементами)
│ └─📄 kandinsky-download-1744821581510.png
│ └─📄 service.png
├─📁 data (папка с данными)
│ └─📄 abbreviations.json
├─📁 llm_extraction (папка со скриптом экстракции информации из сообщений)
│ └─📄 yandex_gpt_extraction.py
├─📁 notebooks (папка с ноутбками (экстрация информации и оценка точности))
│ └─📄 llm_extraction.ipynb
│ └─📄 precision_estimation.ipynb (ноутбук для определения точности работы алгоритма)
├─📁 testing_scripts (папка с тестовым скриптом)
│ └─📄 save_messages_to_word.py
├─📁 whatsapp_parser (папка со скриптом парсинга сообщений из WhatsApp)
│ └─📄 wa_parser (1).py
│ 📄 .env.example
│ 📄 .gitignore
│ 📄 README.md
│ 📄 install.bat
│ 📄 install.sh
│ 📄 poetry.lock
│ 📄 pyproject.toml
│ 📄 start.bat
│ 📄 start.sh
- 🐍 python 3.11
- 🐼 pandas
- 📄 openpyxl
- 🤖 selenium
- ⚙️ webdriver
- 🛠️ poetry
- 🧠 yandexgpt-lite
- 📋 structured output
Весь код оформлен по ❗PEP 8❗

