Obrigação para Data Scientists & Analistas: Treinamento Cerebral para o Pensamento Analítico

Traduzido de: Must for Data Scientists & Analysts: Brain Training for Analytical Thinking

Autor: 

Introdução

Vamos começar este artigo com um pequeno exercício. Pegue uma caneta e papel e escreva a resposta como ela vem à sua mente, sem pensar duas vezes. Você não deve demorar mais de 15 segundos para fazer isso.

Neste papel, escreva por favor a resposta à pergunta “Quais são as habilidades necessárias para se tornar um cientista de dados bem sucedido?

Muito do que você deve ter escrito é codificação, conhecimento de ferramentas de análise, estatísticas, etc. Todos estes são definitivamente necessário para ser um cientista de dados bem-sucedido, mas eles não são suficientes.

Uma das habilidade mais importantes para diferenciar um bom cientista/analista de dados do mau é a capacidade de pegar problemas complexos, colocar um framework em torno deles, fazer suposições simplificadoras, analisar o problema e, em seguida, chegar a soluções. E ferramentas de análise são apenas um meio de fazer isso.

No artigo de hoje vamos ver, em um estudo de caso, este processo de resolução de problemas de forma estruturada.

O que você vai aprender?

Aqui você vai encontrar problemas práticos para treinar o seu cérebro a pensar analiticamente, enquanto resolve problemas complexos. Esta formação do cérebro não só irá apresentá-lo a uma nova abordagem para resolver problemas, mas também irá ajudá-lo a pensar mais rápido ao lidar com números!

Meu artigo anterior sobre como treinar sua mente para o pensamento analítico?  deve ser um bom ponto de partida.

Problema Prático

Esta é minha rotina diária:

Eu me preparo para sair de casa para o escritório às 10:30 todos os dias úteis. Considerando a quantidade de trabalho que tenho para alguns dias, tento chegar mais cedo dirigindo mais rápido do que outros dias (obviamente em limites seguros).

No entanto, nos últimos 5 dias, observei que levo quase o mesmo tempo para chegar no escritório, independentemente da minha velocidade média entre semáforos. Isso me fez pensar se o tempo de minha casa para o escritório é dependente da minha velocidade ou não? Em outras palavras, a velocidade média total é ajustada pelos semáforos no mesmo nível e não depende da velocidade do carro!

Faça o teste: Devo me tornar um cientista de dados?

Para explicar melhor, considere um cenário simplista:

Dois carros começam a partir do ponto A, que é o primeiro sinal de trânsito. Ponto B é um sinal de trânsito com um tempo de parada de 60 segundos e unidade de tempo de 20 seg. A distância entre A e B é de 600m. Car1 começa a 5 m/seg e car2 começa a 6 m/seg. Quem vai atravessar o semáforo em primeiro lugar?

Aqui estão os pressupostos:

  1. Os semáforos estão configurados para velocidades médias, torna-se verde 120 segundos (600 m / 5 m/seg) após o primeiro sinal ficar verde.
  2. Os semáforos ficam verdes durante 20 segundos e vermelho durante 60 segundos (20 * 3)

Suponha que ambos os carros começam em 0 seg.

Tempo necessário para Car1 atingir sinal B = 600/6 = 100 seg
Tempo necessário para car2 atingir sinal B = 600/5 = 120 seg
A luz é verde em (40, 60); (120, 140); (200, 220); (280, 300)

Por isso, os carros que atingem o ponto B em 61 seg e um que chega em 140 segundos não terão nenhuma diferença em termos de passar o segundo sinal. Vamos calcular as velocidades mínima e máxima que irão mostrar que não faz nenhuma diferença entre o cenário de dois semáforos:

Velocidade mínima = 600 m / 120 seg = 5 m/seg = 18 km/h
Velocidade máxima = 600 m / 61 seg = 9.8 m/seg = 35 km/h

Não importa se você dirigir a 18 km/h ou a 35 km/h neste cenário, você irá cruzar o segundo sinal (B) ao mesmo tempo. Em geral, é difícil dirigir a diferentes velocidades nos horários de pico de trânsito. Portanto, as minhas preocupações parecem ter lógica. Eu provavelmente não tenho nenhum controle sobre o tempo que vou demorar para chegar ao escritório (obviamente isso é uma super simplificação do problema).

Vamos torná-lo mais complexo …!

Agora temos 4 sinais A, B, C e D. Os mesmos dois carros começam a partir de A no tempo 0 seg. As distâncias entre AB, BC e CD são as mesmas. A questão agora é, quem vai atravessar o sinal D em primeiro lugar.

Sem entrar em matemática, a resposta é muito simples. Se ambos atravessarem B ao mesmo tempo, o par A – B é o mesmo do par B-C, que por sua vez é o mesmo do par C-D. Assim, ambos carros vão atravessar D ao mesmo tempo. O cenário é realmente mais extremo, o carro que mantém uma velocidade média de 18 km/h e o de 35 km/h cruzarão D ao mesmo tempo. Isso reforça ainda mais a minha hipótese.

A pergunta então se resume a:

"Sou apenas um fantoche indefeso na mão da polícia de trânsito durante a condução para o meu escritório?"

Vamos tentar generalizar o problema em uma equação paramétrica

É muito difícil generalizar o cenário real para este artigo, então vamos partir de algumas suposições:

  1. Semáforos ficam verde para o tempo t seg e tornam-se vermelho para o tempo de 3t seg
  2. A velocidade média de um veículo na estrada é v m/seg
  3. O desafiante para as unidades médias dos veículos dirige a uma velocidade x vezes v m/seg
  4. Todas as estradas têm um comprimento de L metros

Até agora, nós já sabemos que pouco importa resolver para um par de semáforo ou mais. Se o condutor mais rápido é capaz de passar o semáforo em um sinal verde antes do veículo médio, ele vai fazer a diferença. Caso contrário, não.

Assim, a diferença de tempo necessário para que isso aconteça será 3t. A seguir é a equação final que estamos resolvendo:

Tempo gasto pelo veículo médio: L/v seg

Tempo gasto pelo veículo mais rápido: L/vx seg

A equação simplifica para

L / v - l/vx > 3t

Dado que x, v, L e t são todos positivos, isto pode ser ainda mais simplificada para:

xL - L - 3tvx > 0
x (L - 3tv) > L

BNGO! Sabemos que L é sempre positiva, por conseguinte, para tornar prática a equação acima, ambos x e (L – 3tv) tem que ser positivos. Isto significa que se 3tv torna-se maior que L, você não tem chance de bater os semáforos. Por exemplo, se t = 30 seg, v = 5 m/seg e L = 145 m, você simplesmente não tem chance, mesmo se andar na velocidade de um tiro de revólver!

Vamos supor alguns parâmetros e entender ainda mais a equação:

Digamos, L = 600 m. A equação torna-se:

x (200 - tv) > 200

Então, aqui estão algumas regras de ouro para tornar possível passar os sinais de trânsito:

  1. Minimizar t (ciclo do semáforo): É possível passar semáforos em localidades de trânsito rápido, onde ele fica verde – vermelho em tempo rápido.
  2. Minimizar v (a velocidade média da estrada): Se a velocidade média na estrada é excepcionalmente baixa, podemos passar os motoristas lentos se dirigirmos rápido (Duh!)
  3. Maximizar x (multiplicador mais rápido): Se nós dirigimos super rápido, ainda podemos ganhar a corrida. Mas aviso prévio se v * t torna-se mais de 200, você não tem nenhuma chance de conseguir

Não perca: Apresentando a arte do pensamento estruturado e análise

Vamos tentar visualizar algumas relações

Média de t em Bangalore é cerca de 20 segundos e a velocidade média é de 5 m/seg. Por conseguinte, a equação torna-se:

x (L - 300) > L

Como pode ser visto no gráfico acima, se x e L são altos o suficiente para cair na região sombreada, temos uma chance de vencer o semáforo.

Vamos resumir nossas descobertas

  1. Não há nenhuma vantagem em dirigir rápido em uma pista onde 3 * o tempo de luz verde * media da velocidade seja maior do que o comprimento da estrada.
  2. Vencer o tráfego é possível se os itens abaixo estiverem a nosso favor:
    1. Alto x. Nós dirigimos muito rápido (não é uma opção segura)
    2. Alto L. Por exemplo dirigir rápido em uma auto-estrada faz sentido
    3. Baixo t: Nenhuma vantagem em dirigir rápido quando temporizador de semáforos for alto
    4. Baixo v: Se a velocidade média na estrada é realmente baixa, podemos vencê-los. Nós já sabíamos disso!

Notas Finais

Espero que você tenha gostado de resolver este problema de tráfego. Tenho certeza de que desafiou o seu pensamento, e esta foi a nossa motivação. Certo?

Neste artigo, usando um caso de semáforo e alguns conceitos de física elementar expliquei a habilidade necessária para construir um alicerce inabalável para se tornar um cientista de dados.


Veja também:


 

Deixe uma resposta