Progetto cofinanziato nell’ambito del programma Clean Sky 2 Joint Undertaking (JU), grant agreement n. 864702. Il JU riceve supporto dal Programma di Ricerca e Innovazione Horizon 2020 dell’Unione Europea, nonché dai membri della Clean Sky 2 JU diversi dall’Unione.
Call: H2020-CS2-CFP09-2018-02
Tipo di Azione: CS2-IA
Codice identificativo della Topic: JTI-CS2-2018-CfP09- LPA-03-16
Programma: H2020-EU.3.4.5.1. – IADP Large Passenger Aircraft
Titolo della Topic: Automated data collection and semi-supervised processing framework for deep learning
Numero della proposta/Acronimo: 864702 – ATCO2
DURATA
01.11.2019 – 28.02.2022 (28 mesi)
BUDGET PROGETTO
€ 800.000
Il progetto ATCO2 intende sviluppare una piattaforma unica che consenta di raccogliere, organizzare e pre-elaborare i dati di controllo del traffico aereo (comunicazione vocale) dallo spazio aereo.
ATCO2 fornirà una piattaforma per raccogliere, archiviare, elaborare e condividere comunicazioni vocali da dati reali di controllo del traffico aereo, sfruttando metodi di deep learning. Le soluzioni di machine learning pianificate consentiranno lo sviluppo di tecnologie per il controllo del traffico aereo. Per ottenere robuste ed elevate prestazioni di riconoscimento vocale, sarà raccolta una grande quantità di dati. Il progetto mira ad accedere ai dati provenienti da datalink ADS-B certificati allineati con la tecnologia di sorveglianza e direttamente dai controllori del traffico aereo forniti dai fornitori di servizi di navigazione aerea.
Incentrato su una robusta piattaforma, il progetto si baserà su una soluzione esistente e ampiamente utilizzata del partner ‘OpenSky network’, garantendo la sua sostenibilità a lungo termine. La piattaforma attuale raccoglie e archivia le informazioni sugli aeromobili trasmesse periodicamente attraverso una rete di ricevitori ADS-B. Sarà esteso per consentire la raccolta, l’archiviazione e la pre-elaborazione delle comunicazioni vocali e il tempo / posizione allineati con altre informazioni relative agli aerei. Il progetto ha come obiettivo sia i comandi vocali emessi dai controllori del traffico aereo sia le conferme di rilettura fornite dai piloti. Oltre ai dati trasmessi, ATCO2 avrà accesso alle registrazioni vocali dei fornitori di servizi di navigazione aerea (es. Austrocontrol). Oltre alla segmentazione automatica (es. individuo che parla, accento, comando specifico), verrà implementato e integrato un robusto riconoscimento vocale automatico per trascrivere automaticamente le comunicazioni vocali. Utilizzerà scenari di apprendimento attivo capaci di miglioramenti iterativi, oltre al post-editing manuale.
Per rispettare il programma CleanSky2, il progetto contribuirà anche in modo significativo alla creazione di una comunità, consolidando una comunità esistente di ‘OpenSky Network’. Gli incentivi del progetto motiveranno gli utenti a caricare e potenzialmente pre-trascrivere i dati per ottenere l’accesso ad altre risorse e a trascrizioni automatiche. Il progetto terrà nella massima considerazione le questioni legali ed etiche riguardanti la privacy, i dati personali, la sicurezza dei dati e altri aspetti correlati.
In via preliminare, il progetto prenderà in considerazione la comunicazione vocale in tempo reale tra i controllori del traffico aereo e i piloti, disponibile direttamente attraverso canali di radiofrequenza accessibili al pubblico o indirettamente dai fornitori di servizi di navigazione aerea (ANSP).
Oltre alla comunicazione vocale, verranno sfruttate le informazioni contestuali disponibili sotto forma di metadati (i.e. dati di sorveglianza).
This project has received funding from the Clean Sky 2 Joint Undertaking (JU) under grant agreement No 864702. The JU receives support from the European Union’s Horizon 2020 research and innovation programme and the Clean Sky 2 JU members other than the Union
Call Reference: H2020-CS2-CFP09-2018-02
Type of Action: CS2-IA
Topic Identification Code: JTI-CS2-2018-CfP09- LPA-03-16
Programme(s): H2020-EU.3.4.5.1. – IADP Large Passenger Aircraft
Topic Title: Automated data collection and semi-supervised processing framework for deep learning
Proposal Number/ Acronym: 864702 – ATCO2
DURATION
01.11.2019 – 28.02.2022 (28 months)
PROJECT BUDGET
€ 800.000
ATCO2 project aims at developing a unique platform allowing to collect, organize and pre-process air-traffic control (voice communication) data from air space.
ATCO2 will deliver a platform to collect, store, process and share voice communications from real world air-traffic control data, exploiting deep learning methods. The planned machine learning solutions are enabling technologies for air-traffic control. To achieve robust and high speech recognition performance, a large amount of data will be collected. The project aims at accessing data from certified ADS-B datalinks aligned with surveillance technology, and directly from air-traffic controllers supplied by air navigation service providers.
Centered on a robust platform, the project will build on an existing and extensively used solution of ‘OpenSky network’ partner, ensuring its long term sustainability. Current platform collects and stores periodically broadcasted aircraft information through a network of ADS-B receivers. It will be extended to allow collection, storage and pre-processing of voice communications, and time/position aligned with other aircraft information. The project targets both spoken commands issued by air-traffic controllers and readback confirmations provided by pilots. In addition to broadcasted data, ATCO2 will have access to voice recordings from air navigation service providers (e.g. Austrocontrol). Besides automatic segmentation (e.g. speaker, accent, specific command), robust automatic speech recognition will be implemented and integrated to automatically transcribe voice communications. It will use active learning scenarios capable of iterative improvements, in addition to manual post-editing.
To comply with the CleanSky2 Programme, the project will also significantly contribute to community building, consolidating an existing community of ‘OpenSky network’. Project incentives will motivate users to upload and potentially pre-transcribe data to gain access to other resources and automatic transcripts. The project will strongly account for legal and ethical issues regarding privacy, personal data, data security and other related aspect.
Preliminarily the project will consider the real-time voice communication between air-traffic controllers and pilots available either directly through publicly accessible radio frequency channels, or indirectly from air-navigation service providers (ANSPs).
In addition to the voice communication, the contextual information available in a form of metadata (i.e. surveillance data) will be exploited.