В SimbirSoft более 1500 специалистов ежедневно решают интересные задачи, которые делают комфортнее жизни миллионов пользователей.
Мы занимаемся сервисной заказной разработкой. Если тебе интересны сложные технические задачи, работа в команде профессионалов и возможность прокачать экспертизу – присоединяйся к нам!
Сейчас мы в поиске Computer Vision Engineer.
Ключевые задачи:
- Извлечение данных из документов (OCR/IDP):
- Разработка и оптимизация пайплайнов для извлечения текста из неструктурированных PDF и изображений (сканы, фото документов).
- Работа с шумом, искажениями перспективы, разными разрешениями и типами документов.
- Применение методов детекции (обнаружение полей документа) и распознавания символов.
- Пост-обработка результатов с использованием языковых моделей или правил для повышения точности.
- Анализ видеопотоков (Video Analytics):
- Разработка алгоритмов для обработки потокового видео в реальном времени или near-real-time.
- Решение классических задач CV: детекция, трекинг (отслеживание) объектов, классификация действий.
- Оптимизация производительности моделей для работы на видеопотоках (баланс скорости и точности).
Общие задачи:
- Участие в построении end-to-end пайплайнов: от получения сырых данных до выдачи результата в бэкенд.
- Сбор и разметка данных, аугментация, обучение и валидация моделей.
- Внедрение моделей в продакшн (ONNX, TensorRT, Docker).
Требования:
- Опыт коммерческой разработки в Computer Vision от 3+ лет.
- Опыт в OCR: Уверенное знание подходов к извлечению текста (Tesseract, EasyOCR, PaddleOCR, TrOCR или собственные модели на базе CNN/Transformer). Понимание разницы между печатным и рукописным текстом.
- Опыт с видео: Глубокое понимание алгоритмов трекинга (SORT, DeepSORT, ByteTrack) и обработки видеопотоков (OpenCV, работа с кодеками, семплингом кадров).
- Классическое CV: Владение методами детекции (YOLO, Detectron2), классификации, сегментации.
- ML стек: PyTorch / TensorFlow, OpenCV, Scikit-image.
- Продакшн: Опыт оптимизации моделей (Quantization, Pruning) и конвертации в ONNX/TensorRT. Уверенное владение Python.
- Инфраструктура: Понимание принципов работы с брокерами сообщений (Kafka, RabbitMQ) для организации потоковой обработки.
Будет плюсом:
- Опыт работы с Transformer архитектурами для зрения (ViT, DETR).
- Навыки работы с большими языковыми моделями (LLM) для пост-процессинга текста (исправление ошибок, извлечение сущностей).
- Опыт разработки на CUDA.
- Понимание специфики работы с RTC (WebRTC, RTSP) протоколами.