Multilingual Text-to-Speech Models for Indic Languages

In this article, we shall provide some background on how multilingual multi-speaker models work and test an Indic TTS model that supports 9 languages and 17 speakers (Hindi, Malayalam, Manipuri, Bengali, Rajasthani, Tamil, Telugu, Gujarati, Kannada).

It seems a bit counter-intuitive at first that one model can support so many languages and speakers provided that each Indic language has its own alphabet, but we shall see how it was implemented.

Also, we shall list the specs of these models like supported sampling rates and try something cool – making speakers of different Indic languages speak Hindi. Please, if you are a native speaker of any of these languages, share your opinion on how these voices sound, both in their respective language and in Hindi.

Read more
Multilingual Text-to-Speech Models for Indic Languages
Source: habrahabr

Detecting attempts of mass influencing via social networks using NLP. Part 2

In Part 1 of this article, I built and compared two classifiers to detect trolls on Twitter. You can check it out here.

Now, time has come to look more deeply into the datasets to find some patterns using exploratory data analysis and topic modelling.

EDA

To do just that, I first created a word cloud of the most common words, which you can see below.

Read more
Detecting attempts of mass influencing via social networks using NLP. Part 2
Source: habrahabr

Detecting attempts of mass influencing via social networks using NLP. Part 1

During the last decades, the world’s population has been developing as an information society, which means that information started to play a substantial end-to-end role in all life aspects and processes. In view of the growing demand for a free flow of information, social networks have become a force to be reckoned with. The ways of war-waging have also changed: instead of conventional weapons, governments now use political warfare, including fake news, a type of propaganda aimed at deliberate disinformation or hoaxes. And the lack of content control mechanisms makes it easy to spread any information as long as people believe in it.  

Based on this premise, I’ve decided to experiment with different NLP approaches and build a classifier that could be used to detect either bots or fake content generated by trolls on Twitter in order to influence people. 

In this first part of the article, I will cover the data collection process, preprocessing, feature extraction, classification itself and the evaluation of the models’ performance. In Part 2, I will dive deeper into the troll problem, conduct exploratory analysis to find patterns in the trolls’ behaviour and define the topics that seemed of great interest to them back in 2016.

Features for analysis

From all possible data to use (like hashtags, account language, tweet text, URLs, external links or references, tweet date and time), I settled upon English tweet text, Russian tweet text and hashtags. Tweet text is the main feature for analysis because it contains almost all essential characteristics that are typical for trolling activities in general, such as abuse, rudeness, external resources references, provocations and bullying. Hashtags were chosen as another source of textual information as they represent the central message of a tweet in one or two words. 

Read more
Detecting attempts of mass influencing via social networks using NLP. Part 1
Source: habrahabr

IDS Bypass at Positive Hack Days 11: writeup and solutions

The IDS Bypass contest was held at the Positive Hack Days conference for the third time (for retrospective, here’s . This year we created six game hosts, each with a flag. To get the flag, participants had either to exploit a vulnerability on the server or to fulfill another condition, for example, to enumerate lists of domain users.

The tasks and vulnerabilities themselves were quite straightforward. The difficulty laid in bypassing the IDS: the system inspected network traffic from participants using special rules that look for attacks. If such a rule was triggered, the participant’s network request was blocked, and the bot sent them the text of the triggered rule in Telegram.

And yes, this year we tried to move away from the usual CTFd and IDS logs towards a more convenient Telegram bot. All that was needed to take part was to message the bot and pick a username. The bot then sent an OVPN file to connect to the game network, after which all interaction (viewing tasks and the game dashboard, delivering flags) took place solely through the bot. This approach paid off 100%!

Подробнее
IDS Bypass at Positive Hack Days 11: writeup and solutions
Source: habrahabr

Пост №5239351

Автор: linogor

Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239351″ }, «headline»: « / ; 1 • ■ ■yv# , f г ^ **% ^ 9 и rW V#f ” 11 В n • Г, A1m l 1 fc / котэ (прикольные картинки с кошками)», «image»: { «@type»: «ImageObject», «url»: «http://img2.joyreactor.cc/pics/post/full/%D0%BA%D0%BE%D1%82%D1%8D-7449699.jpeg», «height»: 1199, «width»: 583 }, «datePublished»: «2022-06-19T10:11:22+03:00», «dateModified»: «2022-06-19T10:11:22+03:00», «author»: { «@type»: «Person», «name»: «linogor» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «» }
Комментировать 
Пост №5239351
Source: Joyreactor

Пост №5239340

Автор: Vladislavski

Как дела, майнеры?Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239340″ }, «headline»: «Как дела, майнеры? / юмор (юмор в картинках) :: картинка с текстом :: Майнеры :: Видеокарта :: Мемы (Мемосы, мемасы, мемосики, мемесы)», «image»: { «@type»: «ImageObject», «url»: «http://img2.joyreactor.cc/pics/post/full/%D0%9C%D0%B5%D0%BC%D1%8B-%D0%9C%D0%B0%D0%B9%D0%BD%D0%B5%D1%80%D1%8B-%D0%92%D0%B8%D0%B4%D0%B5%D0%BE%D0%BA%D0%B0%D1%80%D1%82%D0%B0-%D0%BA%D0%B0%D1%80%D1%82%D0%B8%D0%BD%D0%BA%D0%B0-%D1%81-%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%BC-7449669.png», «height»: 1679, «width»: 1694 }, «datePublished»: «2022-06-19T09:55:13+03:00», «dateModified»: «2022-06-19T09:55:13+03:00», «author»: { «@type»: «Person», «name»: «Vladislavski» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «» }
Комментировать 
Пост №5239340
Source: Joyreactor

Пост №5239310

Автор: SAMOWAR

Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239310″ }, «headline»: «Аноним 08/06/22 Срд 08:10:34 #5 №269195238 ЧАЙ С ПЯТЬЮ ЛОЖКАМИ САХАРА И "БУТЕРБРОД" С МАСЛОМ И САХ / двач :: тредшот :: приколы для даунов», «image»: { «@type»: «ImageObject», «url»: «http://img2.joyreactor.cc/pics/post/full/%D0%BF%D1%80%D0%B8%D0%BA%D0%BE%D0%BB%D1%8B-%D0%B4%D0%BB%D1%8F-%D0%B4%D0%B0%D1%83%D0%BD%D0%BE%D0%B2-%D0%B4%D0%B2%D0%B0%D1%87-%D1%82%D1%80%D0%B5%D0%B4%D1%88%D0%BE%D1%82-7449606.png», «height»: 1307, «width»: 1080 }, «datePublished»: «2022-06-19T09:12:16+03:00», «dateModified»: «2022-06-19T09:12:16+03:00», «author»: { «@type»: «Person», «name»: «SAMOWAR» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «АРОМ @ ВОДКА И ПИВО ПО ЛЮБОМУ ПОВОДУ @ "ВОТ НАША ДОМАШНЯЯ ЕДА ЭТО САМОЕ ПОЛЕЗНОЕ, А ВРАЧИ ЭТИ ШАРЛАТАНЫ ВСЕ" КОТЛЕТКИ ИЗ ХУЕВОГО МЯСА С ТОННАМИ МАСЛА И МАЯНЕЗИКА @ ЖАРЕНАЯ КАРТОШКА С САЛОМ "ПРОЩАЙ ПЕЧЕНЬ" dUiz-GRdlJl.jpg @» }
Комментировать 
Пост №5239310
Source: Joyreactor

Пост №5239281

Автор: Dominus Ignis

Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239281″ }, «headline»: «vdangerouskrïdeэрич$псиэ6иррл / Dante :: Lady (Devil May Cry) :: nero (devil may cry) :: Vergil :: DMC комиксы :: Devil May Cry :: Dangerous Bride :: artist :: Игры», «image»: { «@type»: «ImageObject», «url»: «http://img2.joyreactor.cc/pics/post/full/Dangerous-Bride-artist-DMC-%D0%BA%D0%BE%D0%BC%D0%B8%D0%BA%D1%81%D1%8B-Devil-May-Cry-7449564.jpeg», «height»: 2000, «width»: 1334 }, «datePublished»: «2022-06-19T08:51:12+03:00», «dateModified»: «2022-06-19T08:51:12+03:00», «author»: { «@type»: «Person», «name»: «Dominus Ignis» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «» }
Комментировать 
Пост №5239281
Source: Joyreactor

Пост №5239273

Автор: Dominus Ignis

Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239273″ }, «headline»: «дракон :: хуманизация (humanization) :: kuma yasuhisa», «image»: { «@type»: «ImageObject», «url»: «http://img2.joyreactor.cc/pics/post/full/kuma-yasuhisa-%D0%B4%D1%80%D0%B0%D0%BA%D0%BE%D0%BD-%D1%85%D1%83%D0%BC%D0%B0%D0%BD%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F-7449556.jpeg», «height»: 4096, «width»: 2903 }, «datePublished»: «2022-06-19T08:49:02+03:00», «dateModified»: «2022-06-19T08:49:02+03:00», «author»: { «@type»: «Person», «name»: «Dominus Ignis» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «» }
Комментировать 
Пост №5239273
Source: Joyreactor

Пост №5239265

Автор: sudoku_gosu

Развернуть { «@context»: «http://schema.org», «@type»: «BlogPosting», «mainEntityOfPage»:{ «@type»:»WebPage», «@id»:»/post/5239265″ }, «headline»: «gentsuki :: art девушка :: Anime Art (Аниме арт, Аниме-арт) :: artist :: art (арт)», «image»: { «@type»: «ImageObject», «url»: «http://img10.joyreactor.cc/pics/post/full/gentsuki-Anime-Art-artist-art-%D0%B4%D0%B5%D0%B2%D1%83%D1%88%D0%BA%D0%B0-7449545.jpeg», «height»: 3000, «width»: 1691 }, «datePublished»: «2022-06-19T08:34:29+03:00», «dateModified»: «2022-06-19T08:34:29+03:00», «author»: { «@type»: «Person», «name»: «sudoku_gosu» }, «publisher»: { «@type»: «Organization», «name»: «JoyReactor.cc», «logo»: { «@type»: «ImageObject», «url»: «http://joyreactor.cc/images/joyreactor_ie6.png», «width»: 207, «height»: 54 } }, «description»: «» }
Комментировать 
Пост №5239265
Source: Joyreactor