В среду, 4 февраля 2015 г., в 16-30, в аудитории 1406 ИСА РАН, состоится открытый семинар молодых ученых ИСА РАН.
Докладчики: Козлюк Д.А., Никитин В.В. НИУ «МЭИ»
Тема доклада: Экспериментальное исследование методов выявления нечётких дубликатов
Аннотация:
Рассмотрены известные методы, в том числе авторский – обобщенный коэффициент ассоциативности (ОКА), для выявления нечётких дубликатов в научных публикациях и критерии эффективности их работы. Сформулирован целевой критерий работы методов, сочетающий требования к полноте и точности. Составлена выборка пар документов, представленных библиографических описанием (заголовками и аннотациями), получены экспертные оценки схожести документов в парах. Проведены эксперименты по установлению наибольшей точности результатов различных методов при ограничении на полноту. Для коэффициента ассоциативности Джаккарда и ОКА, продемонстрировавших наилучшие результаты, предложены и апробированы способы повышения точности до 74% при полноте 90%.
Ключевые слова: Анализ текстовой информации, нечёткие дубликаты, наукометрия.
Семинар открытый, приглашаются все желающие!
|