Разработка аналога Gotomypc (http://www.gotomypc.com). Программный продукт, который позволяет обеспечить удаленный доступ к консоли домашнего компьютера. Отличие от обычных удаленных консолей, таких, как VNC, PCAnywhere или терминальных серверов (Citrix ICA, Windows Terminal Server), состоит в том, что компьютер, к которому осуществляется доступ, может не иметь реального IP адреса. Единственное требование состоит в том, чтобы он имел
постоянное подключение к Интернет.
Более подробная информация о текущем состоянии проекта может быть найдена на странице проекта по адресу http://swsoft.nsu.ru/~korolkov/rc/.
Eskimo
Разработка клиент-серверных приложений часто оказывается достаточно дорогой и продолжительной, если вести разработку с нуля. Это обусловлено несколькими причинами: Во-первых, это необходимость разработки многопоточного приложения для обеспечения параллелизма при обработке клиентов, во-вторых, это необходимость создания интерфейса взаимодействия администратора системы и серверного компонента, обслуживающего клиентов. Эти и многие другие причины не позволяют разработчику сконцентрироваться на протоколе, каждый раз заставляя его реализовывать множество побочной функциональности.
Цель данного проекта – создание универсальной платформы, пригодной для написания большинства серверных приложений, которая обеспечит параллелизм при обработке клиентов, обеспечит возможность настройки компонент и контроля их работы. Также будет предложен общий интерфейс доступа к БД, предназначенный для сохранения внутреннего состояния компонент между сеансами работы. Компоненты, написанные сторонними разработчиками, могут быть установлены на сервер и позволят обслуживать клиентов, которые могут быть реализованы на различных языках программирования. Домашняя страница
Проекты в разработке
Test Grid
Цель проекта – создание системы распределенного тестирования приложений с использованием технологий GRID. Тестирование является одним из важнейших этапов разработки приложения, всестороннее тестирование – сложный, долгий и ресурсоемкий процесс. Но, тем не менее, необходимый. Для облегчения и автоматизации этого процесса и нужна наша система. Суть GRID-технологии в том, чтобы обычные компьютеры, соединенные в обычную сеть, превратить с помощью только лишь программного обеспечения в единый вычислительный ресурс, способный решать большие задачи, чем-то напоминающий кластер.
В нашем случае этот ресурс будет использоваться для решения задачи тестирования как программ в целом, так и их отдельных частей. Это означает, что программист, работающий над некоторым компонентом, имеет возможность написать несколько тестов для своего компонента и выложить это в GRID. Далее система подбирает подходящие машины из имеющихся в наличии и запускает на них тесты. Результаты тестирования передаются пользователю.
Очевидно, система будет полезна любой фирме, занимающейся разработкой приложений и имеющей в своем распоряжении сеть из нескольких компьютеров.
Спам (массовая рассылка почты, преимущественно рекламного содержания) представляет собой одну из наиболее раздражающих проблем для современного Интернет. В последние годы довольно большой успех имели антиспамовые фильтры, основанные на вариантах Байесовского фильтра, однако этот подход имеет довольно много недостатков и ограничений. Главным недостатком является то, что байесовский фильтр использует ограниченное число формальных признаков (особенности заголовка письма, ключевые слова в его теле и т.д.); спаммер, знающий особенности, на которые ориентируются популярные фильтры, может построить письмо, лишенное этих особенностей, и, таким образом, обойдет эти фильтры.
В рамках проекта предполагается разработка интеллектуального фильтра, основанного на контент-анализе письма. Более подробная информация о проекте и его текущем состоянии находится на странице проекта по адресу http://swsoft.nsu.ru/~conqueror/
Анализ логов
Целью проекта является автоматизация анализа данных системной статистики и определение отклонений в работе компьютерной системы, которые могут возникать при атаках, заражении вирусом или сетевым червём, сбое аппаратуры и других потенциально опасных ситуациях. Для обнаружения этих аномалий используются методы data mining, которые выделяют некоторые закономерности в данных и при их нарушении сообщают об аномалии.
Основной задачей является создание приложения, ведущего сбор показаний системных счётчиков и позволяющего пользователю манипулировать анализизирующими плагинами с заложенными в каждый из них специфическими алгоритмами обнаружения аномальной активности и в реальном времени получать осмысленные предупреждения удобным способом.
Эвристические и обучающиеся анализаторы сетевого траффика – также перспективное направление, в рамках которого ведется довольно много исследовательских работ, но пока еще мало коммерчески успешных продуктов.
Более подробная информация о проекте и его текущем состоянии находится на странице проекта по адресу http://swsoft.nsu.ru/~shishkin.
Распределенное хранилище
Разработка пиринговой сети с распределённым хранением файлов. Суть распределённого хранения такова: на каждом отдельном носителе хранится не сам файл с данными а лишь его часть, при чём по ней невозможно узнать, что хранится в файле. Для восстановления файла необходимо иметь некое, заранее известное число этих частей. Части распределяются по разным узлам, что обеспечивает высокую отказоустойчивость системы, при условии, что достаточно много узлов сети подключены к ней в любой момент времени. Страница проекта: http://swsoft.nsu.ru/~chebotarev/
Watchdog (Распределённая система мониторинга сети)
В наше время существует огромное количество серверов, на которых запущены различные сервисы (e-mail server, ftp server, http server etc.) и часто от работы какого-либо из этих сервисов зависит работоспособность других. Также многие из этих серверов администрируются удалённо. Следовательно появляется необходимость постоянного слежения за работоспособностью огромного числа сервисов. Такая необходимость есть как у администраторов серверов, так и у тех, чья работоспособность напрямую зависит от работоспособности каких-либо сервисов. Как раз для этого создаются подобные системы мониторинга.
Наша система обеспечивает периодическое тестирование работоспособности различных сетевых сервисов (http, ftp, e-mail etc.) и своевременное оповещение заинтересованных лиц о сбоях, интересующих их сервисов, по средствам e-mail, icq, sms etc. Также в системе предусмотрена возможность сбора различной информации с тестируемых серверов, например, температура процессора, свободное место на винчестере и т.п. Система предоставляет возможность гибкой настройки оповещений для каждого конкретного пользователя. http://swsoft.nsu.ru/~pauls
Анализ и упаковка звука
Задача распознавания звука актуальна в данный момент для многих современных приложений.
В рамках данного проекта предполагется построение самообучающегося анализатора звукового потока,с возможностью распознавания как человеческого голоса так и музыкальных инструментов.
В данном програмном продукте применяется новый метод выявления нужного звукового сигнала,основанный на резонаторах, позволяющий анализировать звуковой поток в реальном времени,т.е. без разбиения на окна и т.д.
Создание комплексного программного обеспечения для автоматизации деятельности отдела персонала в IT-компаниях, эффективное использование информации и сокращение времени на обработку индивидуальных данных, хранение и защита информации от несанкционированного доступа.
Конечный продукт должен состоять из 2-х частей: система поддержка рекрутинга и система слежения за ростом сотрудников в компании. Планировалось, что вс система полностью будет реализована на ASP.NET + C#.
Весной 2007 превая часть системы (поддержка процесса рекрутинга) была принята в тестовую эксплуатацию в компанию. В связи с тем, что политика компании несколько изменилась, сейчас происходит перенос этой части системы на PHP + Postgress.
Безопасный браузер
Как известно, подключение к Интернет в современных условиях сопряжено со значительными проблемами с точки зрения безопасности.
Радикальным решением этой проблемы был бы запуск браузера и, возможно, других интернет-программ в отдельной виртуальной машине. После каждого сеанса работы образ этой виртуальной машины уничтожается, а при следующем запуске восстанавливается с гарантированно чистого образца. В отличие от VMWare и других аналогичных решений, основная ОС не должна иметь доступа к физическому интерфейсу, через который осуществляется доступ в сеть; этот интерфейс должен управляться виртуальной машиной. Это защищает пользователя от атак, осуществляемых через ошибки в драйверах протоколов сетевого и канального уровня. Максимум, к чему сможет таким образом получить доступ взломщик – это виртуальная машина, которая будет уничтожена при остановке и не имеет доступа к ценным пользовательским данным.
В рамках проекта предполагается исследование вариантов реализации такого решения – различные ОС, запускаемые в виртуальной машине, различные подходы к их запуску и восстановлению образа и к интеграции виртуализованной ОС в пользовательский интерфейс основной операционной системы.
Mobile Morse
Одна из важнейших проблем, ограничивающая применение портативных компьютеров (КПК, смартфонов и др.) – это отсутствие удобного средства ввода текста в эти устройства. Наиболее популярный метод – набор букв многократными нажатиями на цифровую клавиатуру, даже с эвристическими расширениями вроде iTap, очевидно не годится для быстрого набора длинных текстов. QWERTY-клавиатуры, присутствующие в некоторых устройствах этого типа, слишком велики для карманного устройства и в то же время значительно уступают обычным клавиатурам по эргономическим характеристикам, так что скорость набора на таких устройствах во много раз уступает скорости нормальной печати на обычной клавиатуре настолького компьютера или ноутбука. «стилусы», аккордные наборы и прочие экзотические методы совершенно непригодны для массового рынка.
В то же время, существует давно известный и хорошо освоенный на практике метод быстрого набора текста с использованием компактного устройства – телеграфный ключ. Зарегистрированный рекорд скорости для полуавтоматического ключа (Vibroplex) составляет 72 слова (360 алфавитных символов) в минуту, что сравнимо с темпом быстрой речи; нормальной скоростью при использовании виброплекса оператором средней квалификации считается 30 слов в минуту, т.е. 150 алфавитных символов в минуту, что сравнимо с темпом работы квалифицированной машинистки на QWERTY-клавиатуре.
Существует ряд устройств для ввода информации в компьютер при помощи азбуки Морзе, но эти устройства ориентированы на использование инвалидами и при их разработке и реализации не ставилось цели достичь высоких скоростей набора. Однако при разработке таких устройств были учтены потребности современных компьютерных интерфейсов; в частности, есть несколько версий расширенного кода Морзе, содержащих аналоги всех клавиш 101-кнопочной клавиатуры IBM PC.
Конечной целью данного проекта является разработка устройства, подключаемого по USB и/или Bluetooth к КПК, смартфонам или даже ноутбукам, которое можно было бы использовать в качестве полуавтоматического ключа для высокоскоростного набора текстов азбукой Морзе.
В настоящее время разрабатывается эмулятор автоматического или полуавтоматического ключа при помощи компьютерной мыши и обучающая программа (аналог клавиатурного тренажера для слепой десятипальцевой печати), позволяющая изучать азбуку Морзе.
Законсервированные проекты
Среда документооборота на основе Wiki
Wiki – еще не вышедшая из экспериментального состояния, но уже популярная технология динамического управления контентом. В рамках проекта предлагается построить на основе Wiki полноценную среду, пригодную для создания корпоративных систем документооборота. Для этого предлагается надстроить над Wiki средства ограничения содержимого документов (формы) и средства репликации документов между серверами, предположительно на основе RSS. В результате Wiki может превратиться в функциональный аналог Lotus Notes / Domino?, реализованный на основе современных технологий.
Игровой проект – «Трехмерный Пакман»
На сегодняшний день существует очень много двумерных «клеточных» лабиринтоподобных игр (пакман, диггер, бомбермэн и т.д.), в том числе с 3D графикой. Данный проект представляет принципиально иной подход к реализации подобных аркадных проектов и является платформой для создания трёхмерных аналогов большинства известных «плоских» игр. Также игровой процесс в трехмерном пакмане несколько отличается от его прототипа – головоломки, элементы 3D шутера, оригинальная система бонусов, основанная на дереве Хаффмана.
В данном продукте предполагается создание следующих элементов:
Универсальный редактор трехмерных карт (лабиринтов)
Игровой движок поддерживающий возможности современных видеокарт
Игровая логика (собственно сама игра) трехмерного пакмана
Целью данного проекта является создание системы, предназначенной для автоматизации документооборота деканата ФИТ НГУ.
Система, которой пользуется деканат в настоящее время, устарела и перестала удовлетворять требованиям деканата. Поэтому было решено разработать новую систему, которая
обеспечивает централизованное и надёжное хранение даннных
является многопользовательской с разграничением прав
позволяет отслеживать все вносимые изменения
позволяет получать различные формы отчётов и статистики
облегчает работу пользователя за счёт минимизации объёма вводимой информации
Проект законсервирован в связи с началом внедрения общеуниверситетской системы UIS.
Балансировка загрузки
Задача балансировки загрузки актуальна для многих приложений, среди которых следует назвать различного рода серверные фермы, особенно у компаний- провайдеров, многопроцессорные и многомашинные вычислительные системы.
В рамках данного проекта предполагается построение системы распределения и перераспределения заданий для многомашинного вычислительного кластера, установленного в центре распределенных вычислений (к.312 главного корпуса НГУ).
Более подробная информация о проекте и его текущем состоянии находится на странице проекта по адресу http://swsoft.nsu.ru/~lobachev.
14. Распределенная система обнаружения вторжений
Основную идею этого проекта можно описать так: чем больше мы знаем о происходящем в сети, тем выше вероятность, что атака или попытка атаки не пройдет незамеченной, т.е. что в собираемой нами информации останутся какие-либо следы, по которым можно определить факт атаки, или даже ее источник. Идеальная система безопасности должна быть комплексной и охватывать всю сеть – для крупных организаций это могут быть тысячи компьютеров, десятки и даже сотни серверов и много сегментов сети.
В ряде отношений интересны также системы сбора информации, охватывающие сети нескольких организаций. Так, зная, что атакуют не только нас, но и соседей, с которыми у нас есть соглашения об обмене информацией, то можно предположить, что это атака сетевого червя или script kiddie (хакера-любителя, сканирующего сеть в поисках известных уязвимостей). Напротив, если атаке подверглись только мы, то можно предположить, что это некая целенаправленная враждебная деятельность. Так или иначе, ответные меры для этих типов атак должны различаться. Впрочем, построение распределенных систем такого рода наталкивается на фундаментальные проблемы: так, вряд ли организация согласится публиковать полную статистику о работе своей сети; утечка некоторых типов информации (например, о топологии сети или известных уязвимостях) даже может сама по себе представлять угрозу с точки зрения безопасности.
Необходимо признать, что простой сбор статистики с большого количества узлов сам по себе бесполезен для обнаружения вторжений: возможные сигналы о вторжении просто утонут в сотнях малоинформативных параметров и сигналов о том, что «все идет как надо». Во всяком случае, ручной просмотр статистических данных даже не очень крупной сети просто невозможен, автоматический же ее анализ представляет многостороннюю и в ряде отношений весьма сложную проблему.
В настоящее время в ряде академических и коммерческих организаций разрабатываются компонентные системы, обеспечивающие сбор, фильтрацию и анализ информации со всей сети. Такие системы включают в себя анализаторы логов, сетевые «снифферы» и анализаторы протоколов и ряд других модулей сбора информации, центры обработки, обеспечивающие как ручной, так и автоматизированный (в том числе «искусственно-интеллектуальный» и эвристический) анализ поступающих данных и системы реагирования (например, автоматически перенастраиваемые сетевые фильтры).
Анализаторы логов и снифферы можно, в свою очередь, разбить на два класса: системы поиска шаблонов (например, сигнатур известных атак), которые просты, но обладают ограниченной эффективностью, и системы эвристического анализа, которые ищут статистические аномалии в данных (сетевом траффике, производительности системы и т.д.) – к этому типу, например, относится программный комплекс, разрабатываемый в рамках проекта «Анализ логов».
Институт IETF (Internet Engineering Task Force) создал специальную группу, IDWG (Intrusion Detection Working Group), которая разрабатывает протоколы для обмена информацией между модулями таких систем. В настоящее время опубликованы черновики протокола IDEF (Intrusion Detection Exchange Format).
В настоящее время проведен литературный поиск и найдено много интересной информации о уже ведущихся разработках, однако у существующей группы не хватило сил, да, надо признаться, и квалификации, для старта проекта. Приглашаются все желающие; если желающих окажется слишком много, возможно разделение на несколько проектных групп, например, выделение в отдельный проект разработки интеллектуального и/или эвристического сетевого сниффера.
Unix shell с мобильного телефона
Разработка новых и новых приложений для мобильных устройств – быстро развивающаяся область информационных технологий. Удаленный доступ к командной строке Unix-систем с мобильного телефона, наверное, нужен немногим, но тем, кому он нужен, он бывает нужен очень сильно.
В рамках этого проекта первоначально предполагалась разработка шлюза WAP- >ssh, но дальнейший анализ показал, что с экономической точки зрения гораздо более привлекателен шлюз SMS->ssh. Это обусловлено как действующими тарифами MTS, так и тем фактом, что SMS поддерживаются всеми мобильными телефонами, а WAP – лишь относительно дорогими моделями. В результате был реализован даже не прямой шлюз, а шлюз ICQ->ssh, позволяющий авторизоваться в Unix, набирать команды shell и получать ответы на них при помощи сообщений ICQ. Доступ к этому шлюзу может осуществляться при помощи услуги MIM (шлюза ICQ<->SMS) сети МТС- Новосибирск.
В настоящее время реализован прототип, который работает, но совершенно неудовлетворителен с точки зрения безопасности. Необходимо исследовать вопрос о том, насколько (и каким образом) ICQ защищен от перехвата и спуфинга сообщений, и как можно (если это вообще возможно) повысить защищенность протокола. В зависимости от результатов исследований, возможно, потребуется разработка другой архитектуры.
В проекте был занят один человек,
Алексей Годицкий, 5 курс ФИТ, автор идеи, архитектор и разработчик.
В связи с защитой диплома работа над проектом останолена, но если у кого-то есть конструктивные идеи – приходите.
Сбор метаинформации о веб-сайтах
В сети существует целый ряд специализированных поисковых машин, которые, вместо поисков по текстам, выдают информацию об узлах, на которых расположены веб-сайты: версии веб-сервера и операционной системе, организации, на имя которой зарегистрированы доменное имя и блок IP-адресов и т.д. Как и в случае с shell c мобильного телефона, такая информация нужна относительно немногим, но тем, кому она нужна, она бывает нужна очень сильно. С технической точки зрения, вся эта информация легко доступна через поля заголовка HTTP-ответа, записи DNS и сервис WHOIS, однако сбор, хранение и систематическое обновление такой информации в масштабах Интернет представляет нетривиальную задачу, которая могла бы заинтересовать многих разработчиков.
Extensible Term Language (ETL) – это попытка создать инструментальную среду, пригодную для быстрой разработки и поддержки интерпретаторов и компиляторов. В отличие от традиционных парсеров, которые в конечном итоге основаны на вариантах формализма Бэкуса-Науэра, ETL предлагает подход, во многом аналогичный XML. Парсер ETL получает на вход описание грамматики на специальном метаязыке и выдает на выходе дерево разбора операторов, аналогичное дереву DOM, или последовательное представление этого дерева. Кроме того, разработчики ETL ставят перед собой цель обеспечить возможность использования тех же самых описаний грамматик в инкрементальных парсерах, которые могли бы использоваться в синтаксически-ориентированных редакторах, утилитах для рефакторинга, round-trip CASE tools и т.д.
Язык описания грамматик ETL беднее формализма Бэкуса-Науэра (разработчики даже не ставили цели реализовать таким методом все существующие или наиболее популярные языки программирования). Главная цель разработчиков – обеспечить возможность переиспользования элементов грамматик и легкое расширение грамматики, вплоть до возможности создания динамически расширяемых компиляторов. Описав на ETL новую конструкцию и реализовав плагин, который обрабатывает эту конструкцию, пользователь компилятора мог бы немедленно получить расширенную версию языка, причем новая конструкция немедленно получала бы полную поддержку во всех вспомогательных инструментах – редакторах, отладчиках, CASE. Последнее требование практически невозможно обеспечить в рамках современных технологий реализации расширяемых языков.
В настоящее время в рамках проекта ETL реализовано описание грамматики языка Java. Предлагается попытаться реализовать на основе этой грамматики полнофункциональный компилятор, генерирующий на выходе байт-код JVM. Это было бы полезно как для демонстрации возможностей новой технологии, так и для уточнения ее ограничений.
В настоящее время существует ряд реализаций языка описания бизнес-процессов BPEL (Business-Process Execution Language), который позволяет описывать процессы документооборота в виде своеобразного расширенного конечного автомата. Эти реализации описывают последовательности событий в системах поддержки бизнеса при помощи графических диаграмм, похожих на блок-схемы или диаграммы UML, и затем обеспечивают исполнение этих диаграмм. При этом каждая «активность» в описании процесса состоит в вызове того или иного компонента существующей системы поддержки бизнеса, например осуществления транзакций над базами данных, предоставления пользователям форм для заполнения и т.д.
BPEL в определенных пределах допускает бизнес-процессы с параллелизмом, однако этот паралеллизм реализован по модели MPI/OpenMPI, в рамках которой процессу навязывается блочная структура (все нити процесса, исходящие из одной точки ветвления, должны объединяться в одной точке слияния). Это значительно упрощает верификацию описаний процессов и реализацию их интерпретатора. Как показывает опыт эксплуатации систем, как основанных на BPEL, так и систем, основанных на других аналогичных моделях, например модели циклов ознакомления и утверждения, многие бизнес-процессы могут быть без особого ущерба «подогнуты» под блочную структуру. Однако с практической точки зрения большой практический интерес могла бы представлять система, способная исправлять диаграммы произвольной топологии.
Существует стандартизованный язык описания бизнес-процессов BPMN (Business Process Modelling Notation), который допускает описания процессов произвольной топологии, однако он считается непригодным для непосредственного исполнения. В действительности задача его непосредственного исполнения не так уж сложна. Предполагается реализация компонентов для Eclipse / Net Beans?, обеспечивающих редактирование и отладку BPNM-диаграмм и их сохранение в форме, пригодной для интерпретации. Кроме того, необходима реализация серверного компонента, который осуществлял бы интерпретацию описания процесса в рамках системы поддержки бизнеса.
Мультимедийный лекторий
Совместный проект с Мультимедиа центром НГУ. В Мультимедиа центре разрабатывается он-лайн лекторий, обеспечивающий трансляцию динамических презентаций по Интернет. Есть идея объединить трансляцию этих презентаций с видео- и аудиопотоком, это позволило бы организовать полноценное чтение он-лайн лекций. Существующее решение состоит в записи видеопотока, его упаковке средствами Windows Media и сохранении в файл. Это дает слишком большую задержку (до нескольких десятков секунд) и рассинхронизацию с презентацией и не приемлемо для работы в режиме он-лайн.
Web GNU CAP
На ФИТ читается курс «Радиоэлектроника». В рамках этого курса студенты изучают основы радиоэлектроники, методы расчетов линейных и нелинейных электрических цепей. Для закрепления пройденного материала и проверки получаемых результатов студентам предлагается замоделировать схемы в Or Cad?-е.
Данный подход обладает рядом недостатков:
студенты тратят около половины занятия на изучения Or Cad?-а
тратят много времени на перерисовку схем и поиск ошибок в ней
С другой стороны, моделируются только те схемы, которые дает преподаватель. Меняются только параметы элементов. Поэтому можно все схемы иметь уже набранные. Но изучение системы, которая с малой вероятностью потребуется студентам в дальнейшем, кажется, не очень разумным.
Предлагается использовать систему GNU CAP (свободнораспространяемый продукт) для счета. Сделать Web интерфейс к ней, в котором студент выбирает схему, задает параметры и отправляет на моделироване. После чего в виде графиков получает результат. Поскольку студенты по большей части моделируют одни и теже схемы с одними и теми же параметрам, то система может быть дополнена прокси сервером.
Реализация данного проекта позволит перевести курс радиоэлектроники в on-line режим.
Триальные проекты
Обзор систем сбора статистики веб-сайтов
На сегодняшний день существует огромное количество систем сбора и анализа статистики веб сайтов. Начиная от интернет счетчиков в виде баннеров (Spylog, Hotlog, Weblog) и заканчивая многофункциональными локальными системами (Cnstat, Awstat, Pifagor). Из этих систем очень немалый процент занимают бесплатные продукты, которые по своей функциональности не уступают платным, а где-то даже превосходят их. Поэтому рядовому владельцу или администратору какой-либо веб системы, при желании не составит труда найти удобную, функциональную и бесплатную систему анализа, для изучения спроса и эффективности своего сайта. Было рассмотрено около сотни различных систем, описаны их плюсы, минусы и некоторые уникальные особенности.