Методы искусственной нейронной сети (ИНС) применяются для контроля дозировки коагулянта на станциях очистки питьевой воды. Скорость дозирования коагулянта нелинейно коррелирует с параметрами сырой воды, такими как мутность, проводимость, pH, температура и т. д. Важным требованием применения является устойчивость системы к ошибочным измерениям датчиков или необычным характеристикам воды. Разработанная гибридная система включает проверку и реконструкцию необработанных данных на основе карты самоорганизующихся признаков Кохонена, а также прогнозирование дозировки коагулянта с использованием многослойных перцептронов. Ключевой особенностью системы является ее способность учитывать различные источники неопределенности, такие как нетипичные входные данные, ошибки измерения и ограниченность информативности обучающей выборки. Представлены результаты экспериментов с реальными данными.
Введение
Водохозяйственная отрасль сталкивается с растущей необходимостью производить очищенную воду более высокого качества с меньшими затратами. Процесс коагуляции-флокуляции является важным этапом производства питьевой воды, позволяющим удалить коллоидные частицы. Основная трудность состоит в определении оптимальной дозировки коагулянта, связанной с притоком сырой воды. Чрезмерная передозировка коагулянта приводит к увеличению затрат на очистку и возникновению проблем для здоровья населения, тогда как недостаточная дозировка приводит к невыполнению целевых показателей качества воды и снижению эффективности работы водоочистных сооружений. На данный момент доступны как ручные, так и автоматические методы прогнозирования оптимальной дозы коагулянта.
Ручные методы в основном включают тестирование в банке. Тестирование в банке включает в себя взятие пробы сырой воды и нанесение различного количества коагулянта на каждую пробу. Через короткий промежуток времени качество воды каждого образца оценивается, и в качестве заданного значения используется дозировка, обеспечивающая оптимальный результат. Операторы меняют дозу и проводят новую пробу баночки, если меняется качество очищенной воды. Недостатками, связанными с тестированием в банке, являются необходимость ручного вмешательства и ограничение контроля с обратной связью. Автоматический контроль коагулянта обеспечивается в основном с помощью потоковых токовых детекторов, которые измеряют остаточный заряд коллоидных частиц цветности и мутности в воде. Поскольку эти частицы имеют отрицательный заряд, а ионы коагулянта имеют положительный заряд, количество добавленного коагулянта определяет величину и знак суммарного электрического заряда.
Система контролирует эту чистую загрузку на заданном уровне, который, как показали испытания в банке, обеспечивает близкую к оптимальной коагуляцию в определенном диапазоне условий сырой воды. Недостатками являются стоимость его эксплуатации и отсутствие адаптации ко всем типам качества сырой воды.
В данной статье рассматривается проблема онлайн-определения оптимальной дозировки коагулянта по характеристикам сырой воды, таким как мутность, pH, проводимость и т. д. Некоторые предыдущие исследования показали потенциальную эффективность такого подхода, основанного на ИНС. Инновационный аспект этой работы заключается в интеграции различных методов в глобальную систему, включая проверку и реконструкцию данных, моделирование дозировки коагулянта и анализ неопределенностей. Учитывая высокую изменчивость входных данных и низкую надежность доступных датчиков, важным требованием приложения является устойчивость системы, работающей без контроля человека, к ошибочным измерениям датчиков или необычным характеристикам воды, например, из-за случайного загрязнения. Особое внимание также необходимо уделить автоматическому проектированию и обучению такой системы на основе обучающих данных (включая этапы проверки данных, выбора входных данных и модели), что должно обеспечить переносимость системы с низкими затратами с одного объекта на другой.
Работа по водоочистке
Очистка воды включает в себя физические, химические и биологические процессы, которые превращают сырую воду в питьевую. Однако, в отличие от большинства промышленных процессов, в которых качество входного сырья находится под контролем, качество данного источника сырой воды может колебаться из-за природных возмущений или случайного загрязнения. Водоочистная станция, которая использовалась в качестве объекта для данного исследования, обеспечивает водой более 300 000 жителей и имеет номинальную мощность для обработки 120 000 м3 воды в день. На рисунке представлен схематический обзор различных операций, необходимых для очистки воды, доступные измерения и точки дозирования коагулянта. Сырая вода добывается из реки и перекачивается на очистные сооружения. Обработка заключается в коагуляции-флокуляции, отстаивании, фильтрации, озонировании, фильтрации и окончательной дезинфекции. Затем вода хранится в резервуаре и готова к транспортировке по сети водоснабжения. Стадия коагуляции-флокуляции, требующая добавления химического коагулянта, является критическим процессом удаления коллоидных твердых частиц.
Методология
Разработанная система была разделена на три модуля: проверка однопараметрических данных, проверка и реконструкция многопараметрических данных и моделирование дозировки коагулянта. Рисунок иллюстрирует структуру системы.
Проверка однопараметрических данных
Поскольку системе приходится работать в режиме онлайн с ненадежными входными данными, поступающими из реального процесса, этап проверки данных имеет основополагающее значение. Цель этого первого шага, называемого проверкой данных однопараметрического датчика, состоит в том, чтобы связать с каждым элементом необработанных данных уровень достоверности. Доверие измеряется действительным числом, принадлежащим. Нулевая достоверность означает «нет достоверности, данные недействительны», а достоверность, равная единице, означает «данные совершенно достоверны». На этом этапе процедура проверки достаточно проста и основана на сравнении каждого сигнала и его производной с диапазоном значений, обычно получаемых при отсутствии ошибочных измерений. Необработанные данные, уровень достоверности которых меньше заданного порога, объявляются недействительными. Хотя в большинстве случаев этих простых подходов оказывается достаточно, обнаружение несоответствий в данных, включающих более одного параметра, требует использования более сложных методов, таких как карты Кохонена.
Проверка и реконструкция многопараметрических данных
Мы предлагаем подход, основанный на использовании самоорганизующейся карты для проверки многопараметрических данных и реконструкции входных данных. Процесс формирования представляет собой процесс обучения без присмотра. Карта определяет отображение пространства входных данных (параметры качества сырой воды) на обычный двумерный массив. С помощью этого метода эволюцию качества сырой воды можно визуализировать в двух измерениях, а атипичные данные или выбросы можно обнаружить путем измерения расстояния между каждым входным вектором и ближайшим к нему эталонным вектором. Для реконструкции каждое недостающее значение данной входной переменной оценивается значением соответствующего компонента в победившем прототипе.
Моделирование дозировки коагулянта
Для моделирования дозировки коагулянта сигмовидный многослойный перцептрон обучался с использованием алгоритма обучения и сокращения. Этот подход основан на следующей общей процедуре. Сначала относительно большая сеть обучается с использованием алгоритма обратного распространения ошибки. Затем сеть исследуется для оценки относительной важности весов, и наименее важные из них удаляются. Реализация этого метода состоит из следующих шагов: 1. Выберите относительно большую начальную сетевую архитектуру. 2. Обучите сеть, используя алгоритм обратного распространения ошибки, примененный к функции ошибки суммы квадратов. 3. Вычислите вторые производные для каждого из весов и оцените значимости. 4. Отсортируйте веса по значимости и удалите некоторые веса с низкой значимостью. 5. Перейдите к шагу 2 и повторяйте, пока не будет достигнут некоторый общий критерий остановки.
Для практического использования система программного обеспечения для прогнозирования оптимальной скорости дозирования коагулянта должна предоставлять не только точечные оценки, но и доверительные интервалы. Бутстрап-выборка использовалась для генерации доверительных интервалов для выходных данных системы. Как показано на рисунке 50 бутстреп-наборов обучающих данных были созданы из исходных обучающих данных путем повторной выборки с заменой. Эти обучающие наборы начальной загрузки использовались для обучения 50 моделей начальной загрузки MLP с использованием той же архитектуры и процедуры обучения, описанной ранее. Нижний и верхний пределы доверительной границы для любых входных данных были получены путем сортировки этих выходных данных и выбора совокупных уровней 10% и 90%. Доверительный интервал обеспечивает верхний и нижний пределы прогноза.
Результаты
Водоочистная станция уже несколько лет хорошо оснащена оборудованием. Доступны различные параметры процесса, такие как проводимость, мутность, pH, температура, растворенный кислород, поглощение УФ-излучения сырой воды и дозировка коагулянта. Необработанная база данных состоит из 100 000 измерений каждой переменной за период 12 месяцев (ноябрь 97 – ноябрь 98) с выборкой каждые 5 минут. Было обнаружено множество неисправностей датчиков, и для обучения было доступно только 1600 измерений каждого параметра.
На рисунке показан широкий диапазон условий сырой воды, которые могут существовать на очистных сооружениях. Мы использовали 70% набора данных для разработки модели, поиска лучшей структуры ИНС и оценки точности прогнозирования с помощью бутстрепа. Другая часть набора данных использовалась для проверки полученной модели. Точность прогноза и доверительный интервал ИНС показаны на рисунке в наборе проверки. Также была разработана модель линейной регрессии для сравнения с моделью нейронной сети. На рисунке показаны результаты линейной модели, параметры которой были оценены с использованием тех же данных, что и ИНС. Точность прогнозирования явно уступает точности модели ИНС.
Выводы
Описана интегрированная система дозирования коагулянта, основанная на неконтролируемых и контролируемых моделях нейронных сетей, а также различных статистических методах. Результаты экспериментов с использованием реальных данных продемонстрировали эффективность и обоснованность этого подхода. В настоящее время проводятся полевые испытания для полной проверки системы перед ее широким распространением на другие объекты. При необходимости большую надежность системы можно обеспечить несколькими методами, такими как (1) оценка входной плотности вероятности с использованием, например, EM-алгоритма с подходом гауссовской смеси (позволяющим определить область действия системы) и (2) распространение неточности восстановленных входных данных с использованием анализа чувствительности и интервальной арифметики. Производительность сети зависит от качества и полноты данных, предоставляемых для обучения системы. Таким образом, постоянное обновление данных обучения, безусловно, улучшит производительность системы. Однако эта модель основана только на предыдущем поведении операторов и результатах баночных тестов. Необходима дальнейшая работа по разработке модели, учитывающей динамику системы, и прогнозированию параметров очищенной воды (в основном мутности) на выходе процесса осветления.