A ciência de dados deixou de ser uma teoria da tecnologia da informação para se tornar uma realidade em diversos se tores da nossa sociedade. Do jornalismo à indústria, do varejo à construção, o processo de coleta, armazenamento e gerenciamento de informações em grande volume são tarefas essenciais para quem busca inovação e quer se manter no mercado cada vez mais competitivo.

É em meio a esse ambiente de busca por inovação e novas tendências que acontece o Data Science Challenge (DSC), competição de ciência de dados promovida pelo Instituto Tecnológico de Aeronáutica (ITA). A disputa está em sua sexta edição como uma das atividades do Engineering Education for the Future (EEF-2024), que acontece entre os dias 16 e 18 de maio, no ITA – campus DCTA, em São José dos Campos (SP).

O DSC tem apoio e orientação do Instituto de Controle do Espaço Aéreo (ICEA), se responsabilizando por utilizar técnicas de Ciência de Dados e Inteligência Artificial na busca por soluções para o controle de tráfego aéreo.

O desafio conta com alunos de graduação e pós-graduação de todo o Brasil, divididos em equipes de até três integrantes. A disputa se deu em duas etapas, sendo que na primeira houve um problema de predição na área da aviação comercial a ser superado. Apenas três equipes se classificaram para a próxima fase, em que os grupos de competidores apresentaram um software que abrigou a solução proposta na primeira etapa.

Sendo assim, os finalistas do DSC no EEF-2024 são:
– Equipe USP/São Carlos: Bruna Corrêa Araújo Castro, Vítor Amorim Fróis e Fábio Henrique Alves Cavaleti
– Equipe ITA (pós-graduação): Manoel Vilela Machado Neto e Jorge Luiz Franco (USP/ITA)
– Equipe Unicamp: João Antônio Goria Silva

As próximas fases serão realizadas no EEF-2024
– 16 a 18/05 – apresentação das equipes finalistas
– 18/05 – anúncio das equipes vencedoras

O DSC atua sob a coordenação do Professor Doutor Filipe Alves Neto Verri e conta também com a participação do Professor Doutor Elton Felipe Sbruzzi, da Professora Doutora Ana Carolina Lorena e do Professor Doutor Vitor Venceslau Curtis.

Nesta entrevista, o professor Verri fala sobre o que é o DSC, como ele opera e quais os ganhos para o desenvolvimento da tecnologia de dados no Brasil.


Prof. Dr. Verri

Qual é o principal objetivo do Data Science Challenge e como ele contribui para a formação dos alunos de graduação e pós-graduação em todo o Brasil?
Filipe Alves Neto Verri: O DSC visa complementar a formação dos alunos simulando um cenário prático e real de desenvolvimento de soluções baseadas em dados. Além da questão prática, os alunos trabalham em equipe, interagem com outros grupos e buscam conhecimento no estado da arte.

Como o DSC incentiva os alunos a buscarem soluções para problemas de predição utilizando dados reais?
Verri: O DSC, por meio de parceria com empresas e entidades do governo, sempre traz problemas reais para serem resolvidos. Isso faz com que os alunos busquem soluções inovadoras e que possam ser aplicadas no mundo real.  Com isso, os participantes têm a oportunidade e o prazer de ver suas soluções funcionando e trazendo benefícios para a sociedade. Muitas vezes isso também provoca oportunidades de emprego e estágios para os participantes.

Quais são as principais áreas de conhecimento exploradas durante o DSC?
Verri: O DSC abrange diversas áreas do conhecimento, como Ciência de Dados, Aprendizado de Máquina, Estatística, Computação e Inteligência Artificial.  Os alunos têm a oportunidade de aplicar o conhecimento adquirido em sala de aula em um cenário prático e real, o que contribui para a consolidação do aprendizado.  Além disso, cada desafio possui um domínio de negócio diferente, por exemplo, aviação civil, controle do espaço aéreo, mecânica, entre outros. Isso simula a característica multidisciplinar do cientista de dados, que resolve problemas de vários domínios.

Como é desenvolvido o protótipo de software que agrega a solução baseada em dados durante o DSC?
Verri: Na segunda fase do desafio, os finalistas recebem instruções da entidade fornecedora dos dados do desafio.  Assim, eles são instruídos a que tipo de software devem desenvolver.  A partir disso, os alunos têm a liberdade de escolher a tecnologia que desejam utilizar, desde que atenda aos requisitos do desafio.  O importante é que o software seja funcional e que a solução baseada em dados seja implementada.

Como a motivação gerada pela busca de soluções para problemas reais e relevantes é sustentada durante o DSC?
Verri: Durante o desafio, criamos um canal de conversas entre os participantes, os professores do ITA e os representantes da empresa ou entidade fornecedora dos dados.  Assim, os alunos podem tirar dúvidas, pedir ajuda e trocar informações.

De que maneira o inter-relacionamento e a capacidade de trabalho em equipe são incentivados durante a competição?
Verri: O DSC é uma competição em equipe.  Assim, os alunos têm a oportunidade de trabalhar em grupo, trocar informações, aprender uns com os outros e desenvolver habilidades de comunicação e liderança.  Além disso, a competição é uma oportunidade de networking, pois os participantes têm a chance de conhecer outros alunos e profissionais da área.  O âmbito da ciência de dados é muito abrangente, e dificilmente um participante sozinho conseguirá avançar no desafio.  Assim, os participantes são incentivados a procurar parceiros com habilidades complementares.

Qual é o papel do reconhecimento mútuo e da valorização das competências e habilidades individuais no contexto do DSC?
Verri: Durante o DSC, os alunos têm a oportunidade de mostrar suas habilidades e competências, além de aprender com os outros participantes, que muitas vezes têm aptidões complementares.  Assim, o reconhecimento mútuo e a valorização das competências e habilidades individuais são fundamentais para o sucesso do desafio.

Como tem sido a evolução do Data Science Challenge desde sua primeira edição durante o EEF em 2019 até sua 6ª edição no evento atual?
Verri: O DSC tem evoluído a cada edição.  A primeira foi um piloto, realizado durante a primeira edição do EEF, em 2019, quando apenas alunos do ITA e da Universidade Federal de São Paulo (UNIFESP) participaram.  A partir de 2020, incluímos os alunos do Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP). Em 2021 abrimos vagas para todas as universidades brasileiras.

Quais foram os principais aprendizados e desafios ao longo das edições anteriores do DSC?
Verri: Encontrar um desafio que seja motivador e, ao mesmo tempo, factível para os alunos é um dos principais estímulos da competição. Além disso, garantir que os alunos tenham acesso a dados de qualidade e que sejam relevantes nem sempre é fácil.

Como o Data Science Challenge contribui para a formação acadêmica e profissional dos participantes, além de prepará-los para os desafios do mercado de trabalho em Ciência de Dados e áreas relacionadas?
Verri: Ciência de Dados é uma área que, imperativamente, academia e indústria andam juntas.  A cada dia, novos métodos e avanços científicos são publicados. Assim, os alunos aprendem a buscar conhecimento no estado da arte de maneira autônoma e eficaz.