В SimbirSoft более 1500 специалистов ежедневно решают интересные задачи, которые делают комфортнее жизни миллионов пользователей.
Мы занимаемся сервисной заказной разработкой. Если тебе интересны сложные технические задачи, работа в команде профессионалов и возможность прокачать экспертизу – присоединяйся к нам!

Сейчас мы в поиске Computer Vision Engineer.

Ключевые задачи:

Извлечение данных из документов (OCR/IDP):
Разработка и оптимизация пайплайнов для извлечения текста из неструктурированных PDF и изображений (сканы, фото документов).
Работа с шумом, искажениями перспективы, разными разрешениями и типами документов.
Применение методов детекции (обнаружение полей документа) и распознавания символов.
Пост-обработка результатов с использованием языковых моделей или правил для повышения точности.
Анализ видеопотоков (Video Analytics):
Разработка алгоритмов для обработки потокового видео в реальном времени или near-real-time.
Решение классических задач CV: детекция, трекинг (отслеживание) объектов, классификация действий.
Оптимизация производительности моделей для работы на видеопотоках (баланс скорости и точности).

Общие задачи:

Участие в построении end-to-end пайплайнов: от получения сырых данных до выдачи результата в бэкенд.
Сбор и разметка данных, аугментация, обучение и валидация моделей.
Внедрение моделей в продакшн (ONNX, TensorRT, Docker).

Требования:

Опыт коммерческой разработки в Computer Vision от 3+ лет.
Опыт в OCR: Уверенное знание подходов к извлечению текста (Tesseract, EasyOCR, PaddleOCR, TrOCR или собственные модели на базе CNN/Transformer). Понимание разницы между печатным и рукописным текстом.
Опыт с видео: Глубокое понимание алгоритмов трекинга (SORT, DeepSORT, ByteTrack) и обработки видеопотоков (OpenCV, работа с кодеками, семплингом кадров).
Классическое CV: Владение методами детекции (YOLO, Detectron2), классификации, сегментации.
ML стек: PyTorch / TensorFlow, OpenCV, Scikit-image.
Продакшн: Опыт оптимизации моделей (Quantization, Pruning) и конвертации в ONNX/TensorRT. Уверенное владение Python.
Инфраструктура: Понимание принципов работы с брокерами сообщений (Kafka, RabbitMQ) для организации потоковой обработки.

Будет плюсом:

Опыт работы с Transformer архитектурами для зрения (ViT, DETR).
Навыки работы с большими языковыми моделями (LLM) для пост-процессинга текста (исправление ошибок, извлечение сущностей).
Опыт разработки на CUDA.
Понимание специфики работы с RTC (WebRTC, RTSP) протоколами.

Computer Vision специалист

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

Разработчик проектов по ИИ

Специалист по компьютерному зрению (высоконагруженные системы видеоаналитики)

Инженер машинного зрения (Computer vision)

Инженер машинного зрения (Computer vision)

Инженер машинного зрения (Computer vision)

Инженер машинного зрения (Computer vision)