Цод: истории из жизни, советы, новости, юмор и картинки — Горячее

THE FUTURE (Forbes): Спецлаб борется с энергетическим кризисом в сфере ИИ-оборудования с помощью 20-ваттного решения⁠⁠

29 дней назад

Главным кирпичиком ЦОД для ИИ стал ВИДЕОБЛЕЙЗЕР

Европейская премия в области инновационных решений 2025 года

THE FUTURE (Forbes): «По мере роста спроса на искусственный интеллект (ИИ) всё большую озабоченность вызывает энергопотребление. Только в прошлом году процессоры Nvidia для искусственного интеллекта потребляли больше электроэнергии, чем 1,3 миллиона американских домов. Согласно отраслевым прогнозам, к концу десятилетия на долю генеративного ИИ может приходиться более 1,5% мирового потребления электроэнергии. Компания Speclab, финалист финала Кубка мира по стартапам 2025 года на Кипре , считает, что отрасль совершенно неверно трактует эту проблему.

Их решение звучит почти слишком хорошо, чтобы быть правдой: процессор, потребляющий всего 20 Вт (как энергосберегающая лампочка), при этом поддерживает ИИ-интеллект в реальном времени для таких приложений, как компьютерное зрение и обнаружение угроз. В отличие от традиционных решений на базе графических процессоров, архитектура Speclab не требует дорогостоящей системы охлаждения и эффективно работает в условиях высокой температуры. Она может работать даже на столбе под солнцем»... Полная статья. (Перевод на русский язык не совсем корректен.)

Спецлаб признан перспективным европейским стартапом в области ЦОД для ИИ.

Показать полностью

mknews

Вот куда делась вся ваша память!⁠⁠

1 месяц назад

Прошлись по огромному ЦОДу в Петербурге, пообщались с инженерами и посмотрели куда девается вся память.

Кому интересно, полный выпуск на 40 минут тут.

[моё] Компьютерное железо Компьютер Цод Дата-центр Серверная Сисадмин Видео Вертикальное видео Короткие видео

Tsaplin.RuVDS

Бизнес

Зачем сейчас VDS-хостинг (ну, кроме трёх весёлых букв)⁠⁠

2 месяца назад

Сейчас мы среднего размера VDS-хостинг. Когда мы только начинали, клиент был нам абсолютно понятен — это были мы сами из прошлого: трейдеры, брокеры, алготорговцы и прочие люди, которые хотят заработать на микроколебаниях курсов.

Но не обрыганы, не подумайте.

У нас были связи во всей этой тусовке, поэтому первыми нашими клиентами стали все крупные игроки: БКС, «Финам», «Атон», «ЦЕРИХ», который потом стал Freedom Finance. Мы даже делали для них инструкции, например, как поставить их торговый терминал «Альфа-Директ» на нашу виртуалку.

Но на этом долго проехать не удалось: со временем эта индустрия сдулась. Сначала упала популярность трейдинга, а потом Центробанк обязал брокеров иметь собственную инфраструктуру. Падение было колоссальным: сегодня тот же «Финам» платит нам, наверное, раз в 20 меньше, чем на пике. Правда, остался один специфический сценарий: некоторые клиенты арендуют у нас серверы с большими дисками, чтобы хранить «тиковые данные» — это гигантские объёмы информации о каждом изменении цены на бирже для обучения роботов.

К счастью, у нас не было просадки. Мы использовали трейдеров как трамплин, а потом начал приходить другой клиент. Сначала это были разработчики, которые нуждались в бэкенде для приложений, месте для Docker-контейнеров или систем мониторинга вроде Zabbix.

Потом подтянулся бизнес. Оказалось, что бухгалтерия в облаке — это очень удобно, и у нас стали массово разворачивать 1С на удалённых рабочих столах (VDI).

Потом пришла волна трёх весёлых букв: спасибо другим трём весёлым буквам. Раньше мы такой фигнёй не занимались, как вдруг это стало массовой потребностью.

Причём появился новый, неожиданный тренд, который мы называем «тоннели в Россию». Люди, оказавшиеся за границей, покупают у нас серверы с российскими IP, чтобы заходить на Госуслуги, в банковские приложения и на другие отечественные сервисы.

Параллельно было много дам с курсов, которые брали сервер, чтобы развернуть бота, который их любит и лайкает.

Сейчас профиль клиента максимально разнообразный: это и ребята, которые пишут telegram-ботов, и те, кто обучает нейросети, скармливая им для анализа тонны данных, например, парся видео с YouTube. После блокировок Slack и ограничений в других мессенджерах пошёл спрос на корпоративную безопасность. Мы сами следуем философии «сделай для себя, а потом предложи другим». Например, мы развернули у себя open-source-мессенджер Element, а потом добавили его в наш маркетплейс, чтобы компании могли за копейки поднять собственный аналог Slack и полностью контролировать коммуникации.

Примерно вот так сейчас используется VDS.

А вот <a href="https://ruvds.com/ru-rub" target="_blank" rel="nofollow noopener">ссылка</a> на сайт.

А вот ссылка на сайт.

Реклама Реклама ООО «МТ ФИНАНС» ИНН 7706424050

Показать полностью 1

Хостинг Бизнес IT Цод Блоги компаний

mknews

Шум вашего интернета | Как работает дата-центр?⁠⁠

3 месяца назад

Мы побывали в одном из самых продвинутых московских ЦОД и пообщались с его инженерами. Рассказываем, как работает большой дата-центр, по каким принципам устроено охлаждение и сколько энергии он потребляет. Посмотрим что внутри серверной стойки, что такое роторные ИБП, чиллеры и фрикулинг.

Версия во вконтакте и на рутуб.

[моё] Компьютер Компьютерное железо Сервер Дата-центр Цод Сети Сисадмин Серверная Видео YouTube

DmitriitheFals

Лига Сисадминов

Российские ЦОД - отставание на поколение. Часть 2⁠⁠

Серия Кудахтеры

3 месяца назад

Вдогон к статье с новостями из РФ (Российские ЦОД - отставание на поколение или куда ставить NVIDIA Grace Blackwell NVLink72), прислали статью с новостями из США.

Новости РФ:

РБК, за пейволлом: iKS-Consulting: в первом полугодии строительство дата-центров в России упало в три раза
Infox: Причины падения числа новых проектов ЦОД в России при росте спроса

В первом полугодии в российских дата-центрах было открыто 3,7 тысячи новых стоек (технических шкафов для установки IT-оборудования), что на три раза меньше по сравнению с аналогичным периодом прошлого года, сообщает исследовательская компания iKS-Consulting. В сравнении с 2024 годом темпы ввода новых мощностей резко падают: тогда они составили 15%, а в 2025 году, согласно прогнозам iKS-Consulting, ожидаются на уровне 5,5%.
В целом, до конца этого года специалисты ожидают появления еще 4,5 тысячи стойко-мест. Снижение темпов, по данным iKS-Consulting, связано с перенесением сроков ввода в эксплуатацию ряда коммерческих дата-центров на 2026 и 2027 годы.

Российские стойки регулярно считают как «5 киловатт на стойку». Это маловато, но сойдет для начала.
Получается ввод примерно 8 тысяч стоек в год и примерно 5 (киловатт на стойку) *8.000 (стоек) = 40.000 киловатт. Можно округлить как «от 50.000 до 100.000 киловатт вводимой мощности».
50-100 мегаватт.

Новости США:

Tomshardware:
Microsoft заявил «самый мощный в мире» центр обработки данных искусственного интеллекта — площадка площадью 315 акров для размещения «сотней тысяч» графических процессоров NVIDIA и достаточного количества оптоволокна, чтобы опоясать Землю 4,5 раза
Оригиналы
Tomshardware: Microsoft announces 'world's most powerful' AI data center — 315-acre site to house 'hundreds of thousands' of Nvidia GPUs and enough fiber to circle the Earth 4.5 times
Microsoft: Inside the world’s most powerful AI datacenter

Ставить туда будут те самые «новые nVidia» -

Azure was the first cloud provider to bring online the NVIDIA GB200 server, rack and full datacenter clusters. Each rack packs 72 NVIDIA Blackwell GPUs, tied together in a single NVLink domain that delivers 1.8 terabytes of GPU-to-GPU bandwidth and gives every GPU access to 14 terabytes of pooled memory.

То есть, Microsoft вводит что-то сравнимое с Colossus от Илона Маска – 150 мегаватт на один датацентр:

The first phase of Elon Musk’s xAI Memphis Supercluster has just reached full operational capacity as the on-site substation goes online and connects to the main power grid. According to the Greater Memphis Chamber, the site will receive 150 MW from Memphis Light, Gas, and Water (MLGW) and the Tennessee Valley Authority (TVA). Aside from that, the xAI Colossus supercomputer also boasts another 150 MW of Megapack Batteries that will serve as backup, allowing it to stay powered in case of outages or during times of increased demand.
Musk’s Colossus is fully operational with 200,000 GPUs backed by Tesla batteries — Phase 2 to consume 300 MW, enough to power 300,000 homes

Вышла и статья с прогнозами по энергетике США:
September 17, 2025 Powering the US Data Center Boom: Why Forecasting Can Be So Tricky

Два американских датацентра от лидеров рынка по 150 мегаватт каждый с одной стороны
Все вводимые мощности датацентров в РФ за год – 50-100 мегаватт.

Мощностей по электричеству в РФ хватает, и даже турбинами своего производства, и даже под Москвой:

03.03.2025 На строительную площадку Каширской ГРЭС (реализация проекта модернизации электростанции ведётся под управлением ООО «Интер РАО – Инжиниринг») доставлена первая произведённая в России инновационная газовая турбина большой мощности ГТЭ-170.1. Оборудование предназначено для реализации проекта строительства двух дубль-блоков ПГУ суммарной мощностью 900 МВт.
Первая произведённая в России инновационная газовая турбина доставлена на стройплощадку ПГУ Каширской ГРЭС

Выводы ?
Выводов не будет. В Китае просто купили, что хотели, через Сингапур:

Через Сингапур в Китай отгрузили новых процессоров Nvidia на 2 миллиарда долларов
Оригинал: Singaporean company with clear Chinese connections spent roughly $2 billion on Nvidia AI processors — and allegedly made them available for Chinese companies or re-exported them to China, according to a recent New York Times investigation. Companies from Singapore have long been suspected of procuring restricted AI accelerators from Nvidia to ship to China, bypassing U.S. sanctions. Although a few smuggling networks have been found, establishing a direct link has been tenuous until now.
Singaporean company with clear Chinese connections spent roughly $2 billion on Nvidia AI processors — and allegedly made them available for Chinese companies or re-exported them to China

Показать полностью

[моё] IT Цод Nvidia Текст

TechSavvyZone

Энтропия информационной инфраструктуры: Стратегии противодействия хаосу в серверных экосистемах корпоративного уровня⁠⁠

4 месяца назад

Аннотация: В современной бизнес-среде серверная комната или дата-центр перестали быть просто техническими помещениями. Они превратились в сложные, динамичные экосистемы, где физические и логические компоненты находятся в постоянном взаимодействии. В данной статье проводится глубокий анализ ключевых аспектов жизни такой экосистемы: энергопотребления и охлаждения, кабельной инфраструктуры, физической безопасности и мониторинга. В противовес описательному подходу, мы предлагаем системный взгляд, основанный на международных и отечественных стандартах (ГОСТ, TIA-942, ISO/IEC 27001). Для каждого аспекта детально разбираются типичные ошибки специалистов, приводятся яркие примеры их катастрофических последствий для бизнеса и предлагаются конкретные, реализуемые на практике варианты решений, направленные на достижение максимальной отказоустойчивости, эффективности и предсказуемости работы всей информационной структуры предприятия.

Введение: От «серверного парка» к «серверной экосистеме»

Бродя по просторам «ИНТЕРНЕТА» наткнулся на довольно неплохое чтиво в виде Статьи «Прогулки по серверному парку», которая была опубликована в далеком 2004 году, по моему мнению она была своего рода гидом по terra incognita для многих молодых IT-специалистов того времени которые только начинали свою карьеру. Она фиксировала состояние индустрии, где серверы были громоздкими, а их размещение зачастую напоминало скорее складское хозяйство, чем инженерное сооружение. Прошедшие два десятилетия кардинально изменили ландшафт. Виртуализация, облачные технологии, контейнеризация и экстремальный рост плотности вычислений на единицу площади превратили серверные помещения в критически важные центры жизнеобеспечения бизнеса. Я решил немного обновить и проанализировать ситуацию и обновить «Гайд» для новичков профессии, «Возможно пригодиться»! Старичкам профессии!, буду очень признателен, за комментарии и возможные дополнения, особо ценные обязательно попадут в продолжение, так как планирую в дальнейшем выпустить цикл статей если аудитория заинтересуется.

Понятие «парк» implies нечто пассивное, статичное. Сегодняшняя реальность требует более динамичной метафоры – «экосистема». Это живой, дышащий организм, где изменение одного параметра (например, температуры на одном стойко месте) немедленно сказывается на других (потреблении энергии, шуме вентиляторов, надежности соседнего оборудования). Основной закон термодинамики – энтропия, стремление системы к хаосу – в полной мере применим и к ИТ-инфраструктуре. Без целенаправленных усилий по ее поддержанию и развитию, инфраструктура неуклонно движется к состоянию беспорядка: кабели спутываются, документация устаревает, системы охлаждения не справляются с нагрузкой, а политики безопасности становятся формальностью.

Цель данной статьи – предложить не просто описание лучших практик, а целостную философию управления этой экосистемой. Мы перейдем от вопроса «Что это?» к вопросам «Почему это важно?», «Что будет, если этим пренебречь?» и «Как сделать это правильно, опираясь на мировой опыт?». Анализ будет строиться на сопоставлении хаотичного, «энтропийного» подхода с системным, стандартизированным, основанным на таких документах, как ГОСТ Р 56952-2022 (аналогичный EN 50600 по дата-центрам), серия стандартов ISO/IEC 27000 по безопасности, TIA-942 для телекоммуникационной инфраструктуры и других.

Раздел 1. Энергоснабжение и тепловой менеджмент: Основа стабильности экосистемы

Электричество – это кровь серверной экосистемы. Его качество, бесперебойность и распределение определяют возможность существования всей системы. Тепло – это ее естественный метаболический продукт, который должен быть эффективно отведен. Дисбаланс в этой паре – самая частая причина катастрофических сбоев.

Анализ текущей ситуации и проблемы

Многие организации, особенно на этапе роста, относятся к энергетике по остаточному принципу. Типичные ошибки включают:

Отсутствие резервирования: Подключение всей критической нагрузки к одной линии электропитания без источника бесперебойного питания (ИБП) или с ИБП, не рассчитанным на длительную работу.

Неправильный расчет мощности: Подключение нового мощного оборудования к уже загруженным электрическим цепям, что приводит к перегрузкам и срабатыванию автоматических выключателей.

Хаотичное размещение оборудования: Установка серверов с высокой тепловой нагрузкой в верхней части стойки, где скапливается горячий воздух, или создание «горячих островков» из-за непродуманной расстановки стоек.

Игнорирование холодных и горячих коридоров: Смешивание потоков холодного и горячего воздуха, приводящее к резкому снижению эффективности системы охлаждения.

Варианты решений для специалистов на основе стандартов

1. Внедрение системы бесперебойного питания с многоуровневым резервированием (N+1, 2N).

Стандарт: ГОСТ Р МЭК 62040-3-2014 (Системы бесперебойного питания. Часть 3). Определяет методы определения производительности и испытаний.

Решение: Для малых и средних серверных достаточно ИБП с топологией VFI (двойное преобразование), обеспечивающего чистую синусоиду и защиту от всех видов помех в сети. Для ЦОДов корпоративного уровня обязательна схема резервирования 2N (два полностью независимых модуля питания, каждый из которых способен нести полную нагрузку). Это защитит от отказа одного из ИБП, а также позволит проводить его плановое обслуживание без прерывания работы.

2. Проектирование и строгое соблюдение организации холодных и горячих коридоров.

Стандарт: TIA-942-B (Telecommunications Infrastructure Standard for Data Centers). Детально описывает требования к компоновке, включая ширину коридоров, высоту фальшпола, размещение перфорированных плит.

Решение: Стойки должны быть установлены фронтами друг к другу, образуя «горячие» коридоры, где горячий воздух отводится к кондиционерам. Тыльные стороны образуют «холодные» коридоры, откуда оборудование забирает охлажденный воздух. Холодные коридоры должны быть герметизированы (с помощью заглушек на пустых юнитах, боковых панелей на стойках и, в идеале, физических потолков). Это повышает температурный дифференциал и эффективность охлаждения на 15-40%.

3. Внедрение системы мониторинга потребляемой мощности (PDU с измерением) и температуры в режиме реального времени.

Стандарт: ГОСТ Р 56952-2022 (Центры обработки данных. Требования к телекоммуникационной инфраструктуре). Рекомендует мониторинг ключевых параметров среды.

Решение: Использование интеллектуальных блоков распределения питания (PDU), которые предоставляют данные о токе, напряжении и потребляемой мощности на уровне каждой розетки или ветви. Датчики температуры должны размещаться не только на входе кондиционеров, но и на входе в стойки, а также на выходе из серверов (в горячих коридорах). Это позволяет строить тепловые карты и прогнозировать перегревы.

Последствия ошибок: Яркие примеры

Пример 1: «Эффект домино» из-за перегрузки цепи. В крупном интернет-магазине перед распродажей в стойку с существующим оборудованием был установлен новый мощный сервер СУБД. Инженер не проверил нагрузку на цепи PDU. Во время пиковой нагрузки автоматический выключатель на PDU сработал. Сервер БД отключился, что привело к падению сайта на 4 часа. Прямые убытки от потерянных продаж составили несколько миллионов рублей, а репутационные потери были еще значительнее.

Вывод: Каждое добавление оборудования должно сопровождаться проверкой нагрузки на электрическую цепь. Интеллектуальные PDU с пороговыми предупреждениями могли бы предотвратить инцидент.

Пример 2: Лавинообразный перегрев из-за нарушения циркуляции воздуха. В дата-центре финансовой компании сервер, расположенный в верхней части стойки, вышел из строя из-за перегрева и отключился. Его вентиляторы перестали работать. Этот сервер создавал значительное аэродинамическое сопротивление. После его остановки горячий воздух от нижестоящих серверов изменил поток и начал засасываться ими же на вход, создавая рециркуляцию. В течение 10 минут последовательно перегрелись и отключились еще 5 серверов, что привело к остановке биржевых торговых роботов. Расследование показало, что в стойке отсутствовали blanking-панели (заглушки), усугублявшие проблему.

Вывод: Физическое расположение оборудования и аэродинамика стойки не менее важны, чем работа кондиционеров. Заглушки – это не «косметика», а обязательный элемент системы охлаждения.

Раздел 2. Кабельная система: Нервная система экосистемы

Кабельная инфраструктура – это нервная система, связывающая все компоненты экосистемы воедино. Ее состояние напрямую определяет производительность сети, простоту управления и скорость реагирования на изменения.

Анализ текущей ситуации и проблемы

«Кабельный спагетти» – бич многих старых и даже не очень старых серверных. Проблемы возникают из-за:

Отсутствие проекта СКС: Прокладка кабелей «по мере необходимости», без единого плана и цветовой маркировки.

Смешение типов кабелей: Силовые и патч-корды, проложенные в одном лотке, что приводит к электромагнитным помехам.

Игнорирование правил прокладки: Резкие изгибы кабелей, превышающие минимальный радиус, что повреждает жилы и ухудшает характеристики.

Отсутствие документации: После ухода администратора, который «все держал в голове», новый специалист тратит недели на распутывание клубка.

Варианты решений для специалистов на основе стандартов

1. Внедрение структурированной кабельной системы (СКС) с четкой иерархией.

Стандарты: ISO/IEC 11801 (Information technology — Generic cabling for customer premises), TIA-942. ГОСТ Р 53245-2008 (Информационная технология. Структурированные кабельные системы. Монтаж и приемка основных узлов).

Решение: СКС должна быть спроектирована с выделением главного кроссового поля (MC), кроссовых полей оборудования (EC) и горизонтальных кроссов (HC). Использование патч-панелей вместо прямого подключения кабелей к коммутаторам. Это создает точку стабильности (стенд с патч-панелями) и точку изменений (патч-корды). Все кабели должны быть промаркированы с двух сторон в соответствии с единой схемой именования.

2. Разделение силовых и слаботочных кабельных трасс.

Стандарт: ГОСТ Р 53246-2008 (Информационная технология. Проектирование основных узлов систем...). Прямо указывает на необходимость разделения трасс или обеспечения расстояния не менее 30 см между силовыми и информационными кабелями при параллельной прокладке.

Решение: Использование раздельных лотков для силовых кабелей и кабелей СКС. Если разделение невозможно, следует использовать экранированные кабели (F/UTP, S/FTP) и заземлять экран. Пересечение трасс должно осуществляться строго под прямым углом.

3. Применение систем управления кабелями (кабельные органайзеры, направляющие).

Стандарт: Рекомендации производителей телекоммуникационных шкафов (например, APC, Rittal) и лучшие практики, описанные в TIA-942.

Решение: Установка вертикальных и горизонтальных кабельных органайзеров на стойках. Использование патч-кордов фиксированной длины (0.5м, 1м, 2м). Это исключает образование свисающих петель и избыточного запаса, которые мешают циркуляции воздуха и доступу к оборудованию.

Последствия ошибок: Яркие примеры

Пример 1: Случайный обрыв критического соединения. В колокейшн-центре технический специалист, пытаясь добавить новый сервер, зацепился ногой за клубок неорганизованных кабелей. Это привело к выдергиванию патч-корда из коммутатора агрегатного уровня. Этим кабелем обеспечивалась связь между основным и резервным центром обработки данных. Сработал механизм репликации, который, столкнувшись с потерей связи, перевел систему в аварийный режим, ошибочно зафиксировав катастрофу в основном ЦОДе. Начался неплановый переход на резервный сайт, который занял 30 минут и привел к недоступности критичных приложений для сотен клиентов.

Вывод: Аккуратная кабельная разводка – это не эстетика, а вопрос отказоустойчивости. Вероятность случайного повреждения правильно организованных кабелей стремится к нулю.

Пример 2: Тайная деградация производительности сети. Компания жаловалась на периодические «зависания» сети хранения данных (SAN) в ночное время, во время выполнения задач резервного копирования. Логи серверов и коммутаторов не показывали явных ошибок. После многомесячного расследования приглашенный эксперт с помощью рефлектометра обнаружил, что один из волоконно-оптических кабелей, проложенных с резким изгибом за стойкой, имел микротрещины. Под нагрузкой (интенсивный трафик бэкапов) оптический сигнал деградировал, вызывая рост количества ошибок и повторных передач, что и проявлялось как «зависание». Проблема была решена заменой кабеля, проложенного с соблюдением минимального радиуса изгиба.

Вывод: Физические дефекты кабеля могут вызывать прерывистые и трудно диагностируемые проблемы. Соблюдение правил монтажа с самого начала сэкономило бы компании десятки тысяч рублей на диагностике и простое.

Раздел 3. Физическая безопасность и контроль доступа: Иммунная система экосистемы

Серверная комната – это сейф, где хранится самый ценный актив компании – ее данные. Физическая безопасность является фундаментом, на котором строится вся кибербезопасность.

Анализ текущей ситуации и проблемы

Ошибки в этой области часто происходят из-за недооценки человеческого фактора:

Упрощенный контроль доступа: Ключ от серверной, который хранится в незапертом ящике, или единый код на двери, известный десяткам людей.

Отсутствие аудита и сегрегации обязанностей: Один и тот же специалист имеет неограниченный физический доступ ко всему оборудованию, может самостоятельно вносить изменения без согласования.

Пренебрежение видеонаблюдением: Отсутствие архивов записей, фиксирующих кто, когда и что делал в помещении.

Варианты решений для специалистов на основе стандартов

1. Внедрение многофакторной системы контроля доступа.

Стандарт: ISO/IEC 27001:2022 (Информационная безопасность, кибербезопасность и защита конфиденциальности — Системы менеджмента информационной безопасности — Требования). Контроль A.7.3 «Физический доступ в зоны безопасности».

Решение: Отказ от механических ключей в пользу электронных систем (карты доступа, брелоки). Обязательное использование двухфакторной аутентификации для доступа в зоны повышенной критичности (например, карта + PIN-код или биометрия). Система должна вести детальный журнал всех событий входа/выхода.

2. Реализация принципа минимальных привилегий и сегрегации обязанностей.

Стандарт: Требованиям отечественного Федерального закона № 152-ФЗ «О персональных данных» (для обработчиков ПДн) и внутренним политикам безопасности.

Решение: Разграничение зон доступа. Например, специалист по сетевым оборудованием имеет доступ только к стойкам с коммутаторами, а администратор СУБД – только к стойкам с серверами баз данных. Физический доступ к ленточным библиотекам с архивными бэкапами должен быть предоставлен крайне ограниченному кругу лиц. Любое изменение в коммутациях (переключение патч-корда) должно фиксироваться в системе заявок.

3. Организация круглосуточного видеонаблюдения с архивом.

Стандарт: Лучшие отраслевые практики, часто требуются стандартами PCI DSS (для платежных систем) и др.

Решение: Установка камер высокого разрешения с охватом всех критических зон: вход, коридоры, лицевые и тыльные стороны стоек. Видеоархив должен храниться не менее 90 дней. Камеры должны быть интегрированы с системой контроля доступа, чтобы событие доступа сразу привязывалось к видеофрагменту.

Последствия ошибок: Яркие примеры

Пример 1: Кража данных уволенным сотрудником. Сотрудник, уволенный из IT-отдела крупного ритейлера, воспользовался тем, что его карта доступа была деактивирована с задержкой в один день. Ночью он прошел в серверную, к которой имел доступ, и, зная пароли (которые не были изменены вовремя), подключился к серверу, скопировал базу данных с персональными данными и платежными реквизитами нескольких сотен тысяч клиентов. Эти данные были затем проданы на черном рынке. Компании пришлось уведомлять клиентов, менять платежные системы и заплатить многомиллионный штраф по 152-ФЗ.

Вывод: Процедура увольнения должна включать мгновенное отключение всех видов доступа – физического и логического. Журналы контроля доступа должны проверяться регулярно.

Пример 2: Саботаж и вывод из строя оборудования. В рамках корпоративного конфликта недовольный системный администратор, имеющий единоличный доступ в серверную, в выходной день отключил питание на нескольких стойках, вызвав остановку производственного конвейера на 12 часов. Убытки от простоя исчислялись десятками миллионов рублей. Так как видеонаблюдение велось только на входе, а журнал доступа не анализировался, доказать умысел сразу не удалось. Только косвенные улики и последующая исповедь самого администратора позволили установить истину.

Вывод: Отсутствие сегрегации обязанностей и полноценного наблюдения внутри помещения создает колоссальные операционные риски. Ни один сотрудник не должен обладать неконтролируемой властью над всей инфраструктурой.

Раздел 4. Мониторинг, документация и управление жизненным циклом: Сознание экосистемы

Способность экосистемы к самодиагностике, прогнозированию и планированию – признак ее зрелости. Это достигается за счет комплексного мониторинга и безупречного ведения документации.

Анализ текущей ситуации и проблемы

Самая распространенная болезнь – «выгорание» процессов документирования:

Документация отстает от реальности: Схемы, нарисованные пять лет назад, не соответствуют текущему состоянию.

Мониторинг «всего подряд» без реакции: Система генерирует тысячи событий, но большая часть из них игнорируется, так как не настроены пороги и приоритеты.

Отсутствие реестра активов и их жизненного цикла: Компания продолжает эксплуатировать сервер, гарантия на который истекла 3 года назад, и узнает об этом только в момент его отказа.

Варианты решений для специалистов на основе стандартов

1. Внедрение системы централизованного мониторинга и управления событиями (SIEM).

Стандарт: ISO/IEC 27035 (Управление инцидентами информационной безопасности).

Решение: Использование систем типа Zabbix, Prometheus, Nagios для сбора метрик (температура, загрузка CPU, свободное место на дисках) и систем типа ELK Stack (Elasticsearch, Logstash, Kibana) или коммерческих SIEM-решений для агрегации и корреляции логов. Настройка правил, чтобы критичные события (например, отказ диска в RAID-массиве, срабатывание пожарной сигнализации) немедленно вызывали реакцию (уведомление по SMS, email, в мессенджер).

2. Ведение единого реестра активов (CMDB - Configuration Management Database).

Стандарт: ITIL 4 (библиотека инфраструктуры IT). Практика «Управление активами и конфигурациями».

Решение: Создание базы данных, где каждый актив (сервер, коммутатор, ИБП) имеет свою запись с указанием производителя, модели, серийного номера, даты ввода в эксплуатацию, гарантийного срока, ответственного, связей с другими активами (какой сервер на каком коммутаторе висит). CMDB должна быть «единственным источником истины».

3. Автоматизация документирования изменений.

Стандарт: Внутренние регламенты компании, интегрированные с ITSM-системами (ServiceNow, Jira Service Desk).

Решение: Любое изменение в инфраструктуре (добавление сервера, смена патч-корда) должно инициироваться через заявку на изменение (Request for Change, RFC). После выполнения изменения ответственный специалист обязан обновить соответствующие схемы в CMDB или системе документооборота. Это делает процесс необременительным и частью рабочего потока.

Последствия ошибок: Яркие примеры

Пример 1: Многочасовой простой из-за отсутствия актуальной схемы. В результате аварии на коммутаторе агрегатного уровня отключилась половина серверов. Команда администрирования начала восстановление, но столкнулась с тем, что схема сетевых подключений была устаревшей. Физическое распутывание кабелей, чтобы понять, какой сервер куда подключен, заняло 4 часа. Вместо потенциально быстрого восстановления путем переключения на резервный коммутатор, простой критически важных систем длился более 6 часов, что привело к остановке онлайн-торговли и срыву сроков по ключевым проектам.

Вывод: Актуальная документация – это не отчет для начальства, а инструмент для аварийного восстановления. Ее стоимость несопоставима со стоимостью простоя.

Пример 2: Цепная реакция отказов из-за пропущенных предупреждений мониторинга. Система мониторинга в течение двух недель генерировала предупреждения о постепенном снижении емкости аккумуляторных батарей в ИБП. Однако эти предупреждения имели низкий приоритет («Warning») и терялись среди сотен других сообщений. Никто на них не отреагировал. Во время плановых работ в городской электросети произошло короткое отключение питания. ИБП должен был обеспечить работу на 15 минут, но батареи отработали менее 2 минут. Серверы аварийно отключились, что привело к повреждению файловых систем на нескольких виртуальных машинах. Их восстановление из бэкапа заняло сутки.

Вывод: Мониторинг без настройки правил эскалации и реакции бесполезен. Критичные для инфраструктуры компоненты (ИБП, охлаждение) должны мониториться с высочайшим приоритетом.

Заключение: От борьбы с хаосом к управляемой эволюции

Серверная экосистема современного предприятия – это сложный организм, требующий не сиюминутных «латаний дыр», а продуманной стратегии управления, основанной на международных и отечественных стандартах. Каждый рассмотренный аспект – энергетика, кабельная система, безопасность, мониторинг – является неотъемлемым звеном в цепи надежности.

Ошибки на любом из этих этапов, как показали примеры, имеют далеко идущие последствия: от прямых финансовых потерь и репутационного ущерба до полной остановки бизнес-процессов. Стратегия, построенная на стандартах (ГОСТ, TIA-942, ISO/IEC 27001, ITIL), – это не бюрократия, а практический инструмент, позволяющий перевести инфраструктуру из состояния непредсказуемого хаоса в состояние управляемой, предсказуемой и надежной системы.

Ключевой вывод заключается в том, что инвестиции в порядок и стандартизацию «железного» уровня многократно окупаются за счет снижения рисков, уменьшения времени простоя и упрощения масштабирования. Борьба с энтропией информационной инфраструктуры – это непрерывный процесс, но именно он позволяет бизнесу не просто выживать, а уверенно развиваться в цифровую эпоху.

Показать полностью 18

[моё] Инженер Статья IT Серверная Сервер Цод ГОСТ Проектирование Технологии Компьютерное железо Автоматизация СКУД Охлаждение Система охлаждения Стандарты Закон Требования Нормы Длиннопост

MindMoney

Лига Инвесторов

Америку шандарахает током все сильней и сильней⁠⁠

4 месяца назад

По данным Управления энергетической информации (EIA), в США ожидается резкий рост спроса на электроэнергию — с 3938 тераватт-часов (ТВт⋅ч) в 2024 году до 5780 ТВт⋅ч в 2050 году.

Дизайнеры МisualСapitalist изобразили эту динамику на графике:

Отдельную визуализацию получила растущая доля спроса на электроэнергию для центров обработки данных в США, 2023–2030 гг.

Так что электроэнергетика сулит инвесторам всех стран приличные доходы

Показать полностью 2

Электричество Электроэнергетика США Цод Дата-центр Длиннопост

AntonBuh

Куда использовать 1000 SSD?⁠⁠

5 месяцев назад

Без особой надежды, кидаю вопрос в интернет)))

У меня имеется больше 1000 SSD объемами 240, 480, 960 гигабайт.

Продать их не вариант, даже не просите.

Вопрос: как их можно использовать?

SSD Цод IT Облачное хранилище Текст

Посты не найдены

1 2 3 4 5 6 7 8

Введение: От «серверного парка» к «серверной экосистеме»

Раздел 1. Энергоснабжение и тепловой менеджмент: Основа стабильности экосистемы

Анализ текущей ситуации и проблемы

Варианты решений для специалистов на основе стандартов

Последствия ошибок: Яркие примеры

Раздел 2. Кабельная система: Нервная система экосистемы

Варианты решений для специалистов на основе стандартов

Последствия ошибок: Яркие примеры

Раздел 3. Физическая безопасность и контроль доступа: Иммунная система экосистемы

Анализ текущей ситуации и проблемы

Варианты решений для специалистов на основе стандартов

Последствия ошибок: Яркие примеры

Раздел 4. Мониторинг, документация и управление жизненным циклом: Сознание экосистемы

Анализ текущей ситуации и проблемы

Варианты решений для специалистов на основе стандартов

Заключение: От борьбы с хаосом к управляемой эволюции

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги