Institute of Formal and Applied Linguistics
banner
ufal.mff.cuni.cz
Institute of Formal and Applied Linguistics
@ufal.mff.cuni.cz
Computational linguistics • Natural language processing • Formal linguistics • Machine translation | at Faculty of Mathematics and Physics, Charles University
Ondrej Bojar on prompt dilution and the role of red team in deep learning models, processes essential for understanding why AI models sometimes bypass safety guardrails, and how to mprove their robustness.

Watch here (in Czech):
🔗 www.ceskatelevize.cz/porady/10969...
January 22, 2026 at 4:45 PM
🍻 We asked around the office what "UFAL" means to them. A mix of academic rigor, hard work, family atmosphere, a great cup of coffee, or a unique team.

Whether we are discussing NLP over beer or collaborating on a multi-generational project, the spirit of UFAL is all about community. Happy 2026! 👇
January 7, 2026 at 1:02 PM
OpenEuroLLM has been mentioned in Forbes magazine among the biggest achievements of Czech science this year. forbes.cz/tricko-proti...
Tričko proti mikrospánku i umělé nanodiamanty. Co objevili čeští vědci?
Co se letos stalo ve vědě v Česku?Podívejte se na výběr jedenácti mimořádných objevů napříč obory.
forbes.cz
December 29, 2025 at 1:35 PM
Check out @zdenekkasner.bsky.social's Animated LLM! A visualization of the innards of language models for you and your class. 👨‍🏫
December 18, 2025 at 4:45 PM
Kristýna Onderková reports a successful poster presentation on Table-to-Text Generation Evaluation (abstract: openreview.net/forum?id=CbD...) AT EurIPS 2025 WORKSHOP "AI for Tabular Data". Her co-authors O.Plátek, Z.Kasner and O.Dusek share the success, but did not taste the special EurIPA beer!
December 9, 2025 at 1:41 PM
Podrobně o workshopu k našemu společnému projektu Infoveillance na blogu Newton Media www.newtonmedia.cz/workshop-inf...
Workshop Infoveillance: Hledáme anomálie na sociálních sítích | NEWTON Media
Ve čtvrtek 27. listopadu 2025 se v prostorách NEWTON Media uskutečnil odborný workshop pořádaný řešitelským týmem projektu Infoveillance – prevence proti in ...
www.newtonmedia.cz
December 8, 2025 at 9:09 AM
Na workshopu
Infoveillance - prevence proti infodemiím budou představeny výsledky nejnovějšího sociologického šetření o používání sociálních médií a kvalitě informací v české populaci. Dozvíte se i novinky o využití technologií pro detekci anomálií
v prostředí síťových digitálních médií.
December 3, 2025 at 1:18 PM
🎧 Ondřej Bojar v novém díle podcastu Alma mater!

📺 Sledujte na YouTube (www.youtube.com/watch?v=I1vS...), poslouchejte na Spotify a v dalších podcastových aplikacích.
Alma Mater: Je neštěstí brát umělou inteligenci za kamaráda, říká doc. Ondřej Bojar z MFF UK
YouTube video by Univerzita Karlova
www.youtube.com
November 26, 2025 at 9:24 AM
Reposted by Institute of Formal and Applied Linguistics
🎮✨ Nový projekt od absolventky @mff.unikarlova.cuni.cz spojuje hudbu, emoce a umělou inteligenci!
Hra „Symphony of Adventure“ totiž místo obvyklých dotazníků sbírá data o emocích v hudbě hraním – a tím pomáhá trénovat AI.
November 17, 2025 at 11:04 AM
EMNLP 2025 is over... and Milan Straka is bringing home an award! 🏆
CorPipe triumphed in the prestigious CRAC25 Shared Task, focusing on multilingual coreference resolution.

Did Milan just CRACk it? We certainly think so! 😉

🔗 Find out more at arxiv.org/abs/2509.17858

#EMNLP2025 #CorPipe #CRAC25
November 11, 2025 at 1:49 PM
If you speak/know speakers of Piedmontese or Neapolitan 🇮🇹, check out @gianlucavico.bsky.social's project, which collects crowd-sourced translations to study how LLMs handle these under-resourced dialects. Anyone can participate! 🎯
We’re collecting crowd-sourced translations in Piedmontese and Neapolitan.
🎯 Goal: see how well LLMs understand these languages.
👉 Participate here (in IT🇮🇹):
- Piedmontese: quest.ms.mff.cuni.cz/crowd-transl...
- Neapolitan: quest.ms.mff.cuni.cz/crowd-transl...
Anyone can join, no need to be fluent!
Welcome to CrowdTranslation
quest.ms.mff.cuni.cz
November 10, 2025 at 2:34 PM
🗓️ Mark the dates!
🌉 #EMNLP2026 will be October 24-29th in Budapest! 🌉

Thanks all for a great conference, and see you at the next one!
November 10, 2025 at 1:04 PM
The EU's 🇪🇺 HPLT project, coordinated by @ufal.mff.cuni.cz is at #EMNLP2025! It has supported it as a silver sponsor, disseminating HPLT results from our booth and through several papers. We'll continue to shape the future of multilingual datasets and models here and in @openeurollm.bsky.social!
November 7, 2025 at 9:03 PM
Excited to share our work at #EMNLP2025! Our team is presenting 12 papers across the main conference and workshops, covering multilingual NLG, LLM agents, coreference resolution, and machine translation.
A thread with highlights 🧵👇
November 7, 2025 at 8:54 PM
Reposted by Institute of Formal and Applied Linguistics
With @andrei-a-manea.bsky.social, we posted a survey on multilingual vision-language models 👉 arxiv.org/pdf/2509.22123
We reviewed 31 models+21 benchmarks. There's a tension between language neutrality (same results across languages) & cultural awareness (context matters differently across cultures)
arxiv.org
October 21, 2025 at 1:30 PM
Zveme na dnešní přednášku Jazykovědného sdružení, kterou od 17:30 přednese prof. PhDr. Eva Hajičová, DrSc.

🔗 Můžete přijít osobně nebo sledovat na zoomu: lnkd.in/eQeST-uG

Téma přednášky: Aktuální členění v době paralelních korpusů

📸 Foto: Vladimír Šigut, UK
October 23, 2025 at 9:02 AM
🚀 PROJECT LAUNCH: Infoveillance is Live! Our AI tool monitors digital media to detect misinformation and enhance public trust/literacy. Fighting infodemics & polarization.

[https://ufal.mff.cuni.cz/grants/infoveillance]
#Infoveillance #AI #Misinformation #PublicTrust #UFAL
October 2, 2025 at 11:46 AM
Reposted by Institute of Formal and Applied Linguistics
Huge win! 🎉 The CLARIN Steven Krauwer Prize 2025 goes to LINDAT/CLARIAH-CZ partners Pavel Ircing & Jan Švec (UWB). They won for their ASR tools for complex Oral History recordings. Their work is vital for global digital humanities!

#CLARIN #LINDAT #StevenKrauwerAward #ASR #OralHistory #DG
October 1, 2025 at 8:39 AM
Šest kolegů vedlo pro DGT (Evropské ředitelství pro překlady) třídenní letní školu v Lucemburku. Učili 40+ pracovníků DGT nejnovější metody strojové podpory překladu a zajištění kvality. Cíl? Zefektivnit překlad legislativy EU do všech členských jazyků!
#DGT #UFAL #StrojovyPreklad #AI #EUTools
September 29, 2025 at 9:31 AM
@Dan Zeman has been invited as a keynote speaker at the ICLC 11 conference! iclc11.ff.cuni.cz/keynote-spea...

#UFAL #ICLC11 #UniversalDependencies #CharlesUniversity #Prague
September 24, 2025 at 7:48 AM
Nahlédněte na kick‐off meeting projektu ✨HumanAId: AI zaměřená na člověka pro udržitelnou a adaptabilní společnost✨.

Projekt se silnou účastí: vede ho FFUK ve spolupráci s MFF UK, FSV UK, PF UP v Olomouci, FÚ AV ČR, prg.ai a Kampusem Hybernská.

#prgAI #HumanAId #OPJAK
1/2
September 23, 2025 at 2:58 PM
And another successfully defended thesis: 👉Dr.👈 Kira Droganova defended her thesis: Dependency Parsing beyond Simple Trees, which focused on enriching syntactic parsing with deeper semantic layers to better capture meaning across languages. Congratulations 🥳
September 23, 2025 at 11:07 AM
🎉 Congratulations to 👉Dr.👈 Tomáš Musil on successfully defending his PhD thesis! 🍻 His talk explored #LLMs, theories of meaning, and their role in LLM #interpretability, highlighting unsupervised discovery of binary semantic features via ICA and the word intruder test.
September 22, 2025 at 10:09 AM
Workshop "Regulace, AI a advokacie – zákulisí legislativy a advokátních inovací" představil OpenEuroLLM jako naději pro evropskou digitální suverenitu a nutnost pro konkurenceschopnost Evropy. Jan Hajič zdůraznil, že Česko se snaží o snižování byrokracie v oblasti AI.

#AI #AIregulation #FutureOfLaw
September 19, 2025 at 2:45 PM
Researchers' Night with @informatfyz.cuni.cz!
You can come to a live podcast recording and try out a real-time automatic interpreting system ELITR. The event is on September 26th.

🔗 czechia.representation.ec.europa.eu/evropsky-den...

#ELITR #AI #Interpreting #MachineTranslation #LanguageTech
September 18, 2025 at 10:19 AM