Модели

вы модель/фотомодель? вас ищут в этом разделе!
4 127 объявлений найдено за последние 3 дня
Здесь показаны примеры поиска клиентов недельной давности.
Подписывайся, чтобы получать информацию обо всех новых клиентах в режиме реального времени!
В марте Минцифры опубликовало проект закона «Об основах государственного регулирования сфер применения технологий искусственного интеллекта». В апреле документ смягчили под давлением бизнеса (на портале regulation.gov.ru поступило 428 предложений от более чем 150 экспертов. Из них учтено полностью - 30, частично - 128), а 23 апреля Совет по кодификации при президенте под руководством Павла Крашенинникова отклонил его с формулировкой «юридически пустая, хоть и модно звучащая инициатива». Тем не менее Мишустин поручил Минцифре внести законопроект в Госдуму до конца весенней сессии (продлена 14 апреля до 26 июля).Что в нём по существу: три категории моделей (суверенные, национальные, доверенные), сертификация ФСТЭК и ФСБ для последних, обязательная маркировка ИИ-контента, требование «учёта традиционных духовно-нравственных ценностей» и ответственность разработчика за результат, если тот «знал заранее о возможности». Юристы, бизнес-ассоциации и президентский совет свои претензии уже выписали - там много про предмет регулирования и противоречия с Гражданским кодексом.Я хочу разобрать другую сторону: техническую. Документ местами читается так, как будто его писали люди, которые видели LLM только в новостях РБК. Пройдёмся по слоям стека.1. Что вообще такое ИИ по этому закону Законопроект описывает «искусственный интеллект» настолько широко, что под определение попадает практически любой софт со статистикой и условной логикой. Ассоциация юристов России уже это зафиксировала: фактически охватывается всё с автоматизацией или машинным обучением.С технической стороны это означает, что в одну категорию закон сваливает:- классические модели машинного обучения вроде логистической регрессии и градиентного бустинга (XGBoost и CatBoost технически относятся к ML, но никто в здравом уме не назовёт катбуст «искусственным интеллектом»); - глубокие сети старого поколения: ResNet для зрения, BERT-подобные модели для обработки естественного языка; - передовые большие языковые модели: GPT-5, Claude Opus 4.7, GigaChat 3 Ultra, Alice AI; - агентные системы с вызовом инструментов, памятью и планированием. У этих штук принципиально разные модели угроз, поверхности атак, режимы отказа и методики оценки. Регулировать линейный классификатор скоринга и автономного агента с доступом к API одной статьёй - это как регулировать перочинный ножик и дрон-камикадзе одной нормой «об острых предметах».Для сравнения. Европейский регламент об ИИ делит системы на четыре уровня риска - от минимального до неприемлемого. Американский фреймворк NIST AI RMF использует отдельные профили для разных классов систем, плюс отдельный профиль для генеративных моделей (NIST AI 600-1). Законопроект Минцифры оперирует понятиями «сервис ИИ», «модель ИИ» и «система ИИ» как почти взаимозаменяемыми. 2. Чинчилла не голосует в Думе Изначально закон требовал обучать «суверенные» модели только на данных российского происхождения. Под давлением бизнеса требование убрали, но идея осталась как декларация. Полезно посчитать в цифрах, почему она нереализуема.Передовые модели обучаются минимум на 10-20 трлн токенов. Llama 3 - около 15T (как уточняет Meta, это уже на два порядка больше Chinchilla-оптимума для 8B, и качество всё ещё росло), оценки для GPT-5 и Claude Opus сопоставимы, DeepSeek-V3 - 14.8T. Закон масштабирования говорит, что оптимальное с точки зрения вычислений обучение требует примерно 20 токенов на параметр, а модели сегодня тренируются сильно сверх этого.Что есть на русском. Русскоязычная доля Common Crawl колеблется в пределах 4-6% от общего объёма, и после дедупликации, фильтрации мусора и качества остаётся порядка 1-2 трлн токенов чистого текста - в лучшем случае. Корпуса, созданные сообществом вроде Taiga, OpenCorpora, ruWiki и ruWikinews меньше на один-два порядка.Между объёмом доступных русскоязычных данных и объёмом, нужным для обучения передовой модели, разрыв примерно в порядок. Для обучения с нуля этого недостаточно, и это видно из публичных законов масштабирования данных.Что на практике делают все, кто обучает русскоязычные большие языковые модели? Берут многоязычные корпуса с русскоязычной добавкой - обычно от 10 до 30 процентов русского в предобучении. Чудес не бывает. И никакая «суверенность» этого не отменит: закон Чинчиллы в Госдуме не зарегистрирован.3. Open-source как несущая конструкция Бизнес в отзывах прямо признал: в России сейчас нет ИИ-моделей, полностью созданных внутри страны. Это не оценка, а констатация факта. Что именно «не российское» в любой современной LLM:Слой стекаЧто используетсяПроисхождениеАрхитектураTransformer, MoE, Mamba, SSMGoogle Brain, Meta AI, академические исследованияТокенизацияSentencePiece, BPE, tiktokenGoogle, OpenAIФреймворки обученияPyTorch, JAX, Megatron-LM, DeepSpeedMeta, Google, Microsoft, NVIDIAРаспределенное обучениеFSDP, ZeRO, Ring AttentionMeta, Microsoft, StanfordИнференсvLLM, TensorRT-LLM, llama.cpp, SGLangUC Berkeley, NVIDIA, ggerganovОценка моделейlm-eval-harness, HELM, AgentBenchEleutherAI, StanfordБазовые весаLlama, Qwen, DeepSeek, Mistral, GemmaMeta, Alibaba, DeepSeek, Mistral, GoogleНет, конечно не значит что своего вовсе нет. Множество примеров того что сделано с нуля в России. Статья не стремится как-то это обесценить - просто если брать как факт что большинство составляющих современной модели не являются произведёнными в РФ, то это немного вводит в дисонанс.Любопытно, что после апрельской редакции «суверенность» стала бухгалтерской категорией: достаточно, чтобы разработчик был российским юрлицом и самостоятельно определял существенные характеристики модели. То есть российское ООО, которое арендует H100 у казахстанского провайдера, скачивает PyTorch с pypi.org, берёт веса Qwen и дообучает их - формально «суверенно». Вся техническая суверенность сводится к ИНН. Из честно обученных с нуля базовых моделей в России (может быть, GigaChat и Alice AI). Всё остальное на рынке - это дообученные Llama, Qwen и DeepSeek. Закон, требующий полной отечественности, одним росчерком вычёркивает 90% участников рынка. 4. Угрозы у LLM есть, методики оценки нет Самое больное. Закон говорит: «доверенные модели» проходят сертификацию ФСТЭК и ФСБ. Прекрасно. По какой методике?Существующая нормативная база ФСТЭК хорошо описывает классические угрозы ИБ (НДВ, периметр, СКЗИ, ПДн). Есть Приказ №117, регулирующий применение ИИ в защищаемых системах. Но это про применение - не про сертификацию самих LLM по их специфическим угрозам.А специфические угрозы у LLM такие:Прямая и косвенная промпт-атака.Обход защитных механизмов модели.Отравление обучающих данных на стадиях предобучения и файнтюна.Закладки в весах модели.Извлечение обучающих данных.Атаки на принадлежность данных к обучающей выборке.Кража модели через API. Утечка системного промпта.Галлюцинации и конфабуляции в чувствительных контекстах.Злоупотребление инструментами в агентных системах.Отравление памяти агента.Каскадные сбои в мультиагентных сценариях.В российской регуляторной базе системного аналога нет. Есть отдельные методические наработки - рекомендации Центробанка по применению ИИ в финансовых организациях, рамочный ГОСТ Р 59276-2020 о доверии к системам ИИ, методические документы ФСТЭК по защите информации в системах с компонентами ИИ или модель угроз кибербезопасности ИИ от Сбера. Но единой методики оценки безопасности именно больших языковых моделей, которую можно положить в основу сертификации, не существует. Получается, закон требует сертификацию по методике, которую ещё предстоит разработать. И разрабатывать её будут параллельно с применением закона, как с СОРМ-3: сначала обяжем, потом разберёмся. Отдельно стоит вопрос про «уважение традиционных духовно-нравственных ценностей». Как именно сертифицировать языковую модель на соответствие? Бенчмарка нет. Метрики нет. Корпуса размеченных данных, на котором можно было бы обучить классификатор «соответствует / не соответствует», тоже нет. Это не правовая категория и не техническая - это эстетическое суждение, которое в законе вписано как требование к допуску модели на рынок. На практике критерии будут устанавливаться в режиме «понимающего взгляда» сертифицирующего органа, а это уже не сертификация, а лицензирование по усмотрению. 5. Маркировка контента Обязательная маркировка фото-, видео-, аудио- и текстового ИИ-контента. Идея гуманная, реализация невозможна. Конкретно:Водяные знаки в тексте сегодня работают так себе. Самая зрелая технология на рынке - SynthID-Text от Google DeepMind, и даже она ломается на простых вещах: перефразирование сбивает сигнал, а прогон через цепочку переводов (русский → английский → русский) добивает то, что осталось. Более ранние схемы с разделением словаря на «разрешённые» и «запрещённые» токены валятся даже от умеренного редактирования. Есть и формальное доказательство, что универсально надёжный водяной знак на текст невозможен в принципе, при условии, что у атакующего есть достаточно мощный перефразировщик. Контрпримеры существуют, но строятся они через поиск по эталонному корпусу, а не через сам водяной знак, и в промышленных условиях не масштабируются. Водяные знаки на изображениях ломаются ещё проще. Современные методы вроде тех, что разрабатывают в Meta и в университетах, в лабораторных условиях работают неплохо, но в реальном мире не выдерживают элементарной обработки: простейшее редактирование, JPEG-сжатие, обрезка изображения, или его скриншот - каждое из этих действий убивает сигнал поодиночке, а в комбинации не оставляет от метки и следа. Обнаружение без водяных знаков работает ещё хуже. Классификаторы вроде DetectGPT, GPTZero и Binoculars на современных моделях дают много ложных срабатываний - особенно на текстах не-носителей языка и людей с шаблонным стилем письма (студенты, чиновники, юристы попадают под удар систематически). C2PA и Content Credentials - это добровольный стандарт происхождения контента, который снимается тривиально: достаточно сделать скриншот, и метаданные исчезают.Технически нет способа достоверно пометить контент так, чтобы метку нельзя было снять, чтобы она переживала редактирование, сжатие и перекодирование, и при этом не давала ложных срабатываний на контент, который написан человеком а не машиной. Эти три требования одновременно невыполнимы.Закон требует того, чего пока не существует...
5 мая 13:10
🎬 Свежие кастинги за последние 20 минут — 4 шт. ⭐ В этом посте — только 1–3 топовых. Весь список в нашем телеграмм боте: ✅ Хочешь получать подходящие кастинги первым (возраст/рост/пол) и без повторов? 🎁 Тестируй бесплатно → https://t.me/Castingi_Agent_bot ────────────── 1. #Москва#Модель Всем привет! Меня зовут Яна ищу: коммерческие съёмки для маркетплейсов, брендов, бьюти-брендов, каталогов, рекламы, ТФП о себе: 1. опыт — более полугода 2. 23 года 3. Рост: 165 4. размер одежды — (S) обувь — (37) 5. параметры — 84-63-94 портфолио отправлю в личные сообщения мой тг: [id214929106|@msyanochka] 🔗 https://t.me/modeli_v_moskve/93189 ✨ ────────────── ✨ 2. 👶 КАСТИНГ | СЪЁМКА КОЛЯСОК 📅 Дата съёмки: 7 мая Ищем очаровательных малышей для уютной съёмки детских колясок 💫 👶 КОГО ИЩЕМ Малыши: — от 6–7 месяцев — до 1,6 лет ✨ Рассматривают живых, естественных малышей ✨ Можно без опыта съёмок 🎁 УСЛОВИЯ Вознаграждение: — подарок — профессиональные фотографии после съёмки 📸 📩 Для заявки переходите в канал с кастингами в телеграм t.me/freshcasting_bot МОСКВА 🔗 https://t.me/kasting_deti_spb_moskow/32079 ✨ ────────────── ✨ 3. МОСКВА! На съемку рекламы банка Дата съемки: 8.05 ВТОРОСТЕПЕННАЯ РОЛЬ: мужчина, волосы темно-русые, Рост 171-173, одежда 46-48. По сюжету это съемки кино. В кадре вы съемочный дублер актера, сидите с ним болтаете. НУЖНО СРАЗУ ПРИСЛАТЬ САМОПРОБУ!!! Текст: Дык у меня такие же условия, я просто перевел ЗП на карту банка в приложении банка! **ПРАВА:** месяц на ТВ (РФ) ОЛВ (весь мир) + добавляем: бессрочно для внутриком и внутренних мероприятий, фестивалей 1 год наружка, все носители Ставка 60.000-20% агентские Смена 12 часов, переработка 2000/час. Оформление по ИП либо СЗ, постоплата в течен… 🔗 https://t.me/castingfilm/196597 ✅ В боте ты видишь своё первым: • без дублей и мусора • лучшие кастинги уходят за 10–30 минут ⚡️ t.me/Castingi_Agent_bot
6 мая 13:42
Москва
Подписывайся, чтобы получать информацию обо всех новых клиентах в режиме реального времени!