
Искусственный интеллект
ChatGPT — не зумер
Видел недавно пост, где ChatGPT называет неправильное время на часах. Миф опровергнут :)
Скриншот, кстати, с нашего сайта, который мы разрабатываем. Скоро будет публичный тест!
WithSubtitles добавляет субтитры к видео
🔥 WithSubtitles — топовый, БЕСПЛАТНЫЙ😎 сервис, позволяющий автоматически добавлять субтитры к вашим видео. Обеспечивает конфиденциальность, позволяя работать прямо в браузере без необходимости загружать что-либо на серверы.
⚙️ Ключевые особенности:
💬 Автоматическое распознавание речи: Сервис использует передовые технологии для точного распознавания аудио и генерации субтитров с точным таймингом.
💬 Настраиваемые шрифты: Встроено множество шрифтов, которые можно кастомизировать под свои предпочтения, обеспечивая уникальный стиль субтитров.
💬 Поддержка видео любой длины: Сервис способен обрабатывать как короткие ролики, так и полнометражные фильмы, обеспечивая гибкость для пользователей с различными потребностями.
Моргают диоды
На вытяжке заменил лэд драйвер и перепаял диод, при проверке (всё ли работает) диоды горят всë норм, как только припаиваю проверяю они моргают. Несколько раз попробовал не осилил. Подскажите что делать. ???
Ответ на пост «Интересный баг чата GPT»1
Почему нейросеть не рисует одну розу и букву "V"? Мы провели расследование
Недавно в DALL·E (нейросети OpenAI для генерации изображений) обнаружили странный баг — она отказывается рисовать одну розу и букву "V". Это вызвало много вопросов, и мы решили докопаться до истины.
Провели серию контрольных тестов, чтобы выяснить, какие объекты блокируются и что их объединяет. Вот что мы выяснили:
Что DALL·E блокирует?
❌ Одиночную розу — но букет рисует без проблем.
❌ Букву "V" — но другие буквы, например, "X", проходят.
❌ Маску Гая Фокса — но обычную белую театральную маску можно.
Что DALL·E НЕ блокирует?
✅ Букет роз — фильтр настроен только на одиночный цветок.
✅ Человека в черном плаще и шляпе — если не упоминать "V for Vendetta".
✅ Серп и молот, китайскую коммунистическую пропаганду — значит, дело не в общей цензуре против левых идей.
В чём причина?
После анализа стало очевидно: все заблокированные элементы связаны с "V for Vendetta" и символикой восстания. Красная роза, буква "V" и маска Гая Фокса — это культовые образы революции, сопротивления и анархии.
Вероятные причины фильтра:
1. OpenAI не хочет, чтобы DALL·E создавал символику протестов и восстаний.
2. Система блокирует "опасные" символы, чтобы их не использовали в политических кампаниях.
3. Возможно, это просто баг, но он явно настроен очень точечно.
Вывод
DALL·E не блокирует коммунизм, социализм или анархизм в целом, но выборочно фильтрует ключевые символы восстания. Это значит, что OpenAI активно контролирует, какие изображения можно генерировать, а какие нет, причём на уровне отдельных слов.
---
Если кто-то хочет проверить сам — попробуйте сгенерировать одну розу, букву "V" или маску Гая Фокса. А если найдете ещё заблокированные символы — пишите, будет интересно расширить этот список!
Qwen выпустили новую «думающую» модель QwQ-32B
Qwen выпустили новую «думающую» модель QwQ-32B, которая обходит топовые нейросети в некоторых бенчмарках. И она абсолютно бесплатная.
Модель пишет код за несколько секунд, решает сложнейшие задачи по математике и понимает огромный контекст в 131 тыс. токенов — этого хватит, чтобы загрузить в бота целую диссертацию и задавать по ней вопросы.
Тестируем в чат-боте Qwen. Надо выбрать QwQ-32B-Preview в списке моделей.
ИИ
Вот смотрю на рекламу защиты от мошенников и жду, когда мой Тинькофф начнёт блокировать звонки Сбера с формулировкой "осторожно, возможно вам звонят мошенники".
Озвучка диалогов с помощью нейросети FishSpeech
Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.
Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.
Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.
❯ Основные особенности FishSpeech🐠
Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.
Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:
Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.
Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.
Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.
Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».
Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.
Мультиязычный интерфейс. Доступны русский и английский.
Автообновления и интеграция с GitHub.
❯ Обзор интерфейса
Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.
Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.
Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.
В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».
Плавно спускаемся ниже.
Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.
Для каждого говорящего доступна отдельная панель настроек. Здесь можно:
Указать имя говорящего, которое должно совпадать с именем в тексте диалога.
Выбрать референсный голос из доступных вариантов.
Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.
Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D
В самом низу находятся расширенные настройки:
Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:
В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.
❯ Примеры и возможности
Начнём с простого — рассуждения Винни-Пуха.
Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.
Сгенерируем диалог с тремя участниками - Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.
Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.
Дмитрий Нагиев и Чебурашка:
Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper, скачать её можно на GitHub. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.
Ещё пара примеров:
Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.
Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут.
Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!
Сколько часов то?
Спросил у пары нейронок: сколько часов в месяц работает работник, если он работает 5 дней в неделю по 8 часов, но каждые 4 дня работает 24 часа. Ни одна не угадала с ответом, даже после уточнений :( Не умеют/знают про выходные дни и что нельзя в один день работать больше 24 часов?







