![]() |
|
||
![]() |
|
| |||||||||||||||||||||||||||||||
Hi-TechСпецслужбы США получили ПО для анализа арабских текстов
5:43PM Thursday, Mar 6, 2003
Компьюлента. 6 марта 2003 года, 17:43
Атака на Нью-Йорк 11 сентября 2001 г. заставила американские спецслужбы внимательнее относиться к текстам и сообщениям на арабских языках. Теперь им в этом послужит подспорьем новое ПО от Basis Technology. Компания Basis Technology выпускает ПО для обработки текстов на всех языках мира. Её программы распознают и анализируют языки, проверяют алфавиты на совместимость с Unicode и проводят многоязыковой поиск в документе. Арабский язык - один из самых трудных для компьютерного анализа, особенно по части поиска данных. Зачастую арабские слова уже несут в себе грамматические элементы, определяющие вид глагола, спряжение, лицо, число, род и др. В итоге, текст на арабском приходится "нормализовать", чтобы обеспечить индексирование, поиск по ключевым словам и другие операции. К тому же, своеобразное использование или полное отсутствие гласных вносит дополнительные трудности. Arabic Language Analyzer (ARLA) представляет собой программный механизм, позволяющий обрабатывать документы, написанные на арабском языке. ARLA легко интегрируется с существующими системами поиска. ARLA выполняет орфографическую и лексическую нормализацию текста, включающую удаление таких частей речи, как союзы, предлоги и местоимения, которые усложняют поиск. В программе используются сложный лингвистический алгоритм и специальная лексика для перевода числительных (включая сложные) в формы единственного числа. Созданный по заказу спецслужб Arabic Language Analyzer расширит возможности американских "органов" в предотвращении возможных террористических атак. Сейчас спецслужбы США испытывают трудности при анализе информации на арабском языке, так как имеющиеся средства ориентированы на латинский алфавит и американскую таблицу кодировки символов. Транскрибирование, выполняемое переводчиками-людьми, часто приводит к разным толкованиям и усложняет обработку текстов. Например, имя главы Ливии Муамара Каддафи имеет около тридцати(!) вариантов написания латиницей. Ранее Basis Technology, в штате которой насчитываются всего 50 человек, выпустила инструменты для работы с китайским, корейским и японским языками. По материалам "Компьюленты"
Другие новости по теме
Toshiba готовит метаноловые топливные элементы
Создателя DeCSS будут судить опять Робот идет в школу вместо ученика Microsoft предлагает вдвое снизить цену Office Новая версия серверной Windows выйдет через десять дней Microsoft присоединилась к Альянсу DVD+RW Intel снижает цены на Pentium 4 и Xeon Японцы разработали систему передачи данных, работающую от человеческого тела Мобильник будущего Microsoft приобрела технологию VirtualPC Intel готовится хоронить BIOS
|
Рассылки:
![]() Новости-почтой TV-Программа Гороскопы Job Offers Концерты Coupons Discounts Иммиграция Business News Анекдоты Многое другое... |
![]() | |
News Central Home | News Central Resources | Portal News Resources | Help | Login | |
![]() |
![]() |
|
![]() ![]() ![]() ![]() |
© 2025 RussianAMERICA Holding All Rights Reserved Contact |