You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Apareceu no meu feed aqui do github o material pra esse curso que me parece muito útil. Seria mto grato se o tivesse tido. :)
Estou me dando o direito de fazer algumas sugestões de bases de dados e suas interlocuções com python que venho usando recentemente.
SQLite (ou qlqr base) + jupyer + plotly
Tem esse tutorial que eu sempre achei super útil e mostra como fazer query de bases de dados grandes usando sqlite.
Recentemente eu descobri que dá pra fazer seus próprios 'comandos mágicos' no jupyter (obviamente). E fiz alguns para trabalhar com sql e acho eles super úteis. Posso te copiar as funções que criei se interessar.
Bigquery e Athena. Essas bases de dados são distribuídas e maravilhosas para trabalhar com mto dado. Eu tenho a impressão que elas serão os 'standard' para trabalhar com bastante dados por um tempo. Não tem que ficar montando servidor, etc.
Para trabalhar com o Athena da AWS tem esse pacote awswrangler que facilita mto as coisas. Tu pode subir um pandas como tabela particionada no Athena em uma linha. Também tem o pyathena para fazer queries.
O bigquery também tem suporte nativo do pandas.
Abraços!
The text was updated successfully, but these errors were encountered:
Opa Renato,
como vão as coisas?
Apareceu no meu feed aqui do github o material pra esse curso que me parece muito útil. Seria mto grato se o tivesse tido. :)
Estou me dando o direito de fazer algumas sugestões de bases de dados e suas interlocuções com python que venho usando recentemente.
SQLite (ou qlqr base) + jupyer + plotly
Tem esse tutorial que eu sempre achei super útil e mostra como fazer query de bases de dados grandes usando sqlite.
Recentemente eu descobri que dá pra fazer seus próprios 'comandos mágicos' no jupyter (obviamente). E fiz alguns para trabalhar com sql e acho eles super úteis. Posso te copiar as funções que criei se interessar.
Bigquery e Athena. Essas bases de dados são distribuídas e maravilhosas para trabalhar com mto dado. Eu tenho a impressão que elas serão os 'standard' para trabalhar com bastante dados por um tempo. Não tem que ficar montando servidor, etc.
Para trabalhar com o Athena da AWS tem esse pacote awswrangler que facilita mto as coisas. Tu pode subir um pandas como tabela particionada no Athena em uma linha. Também tem o pyathena para fazer queries.
O bigquery também tem suporte nativo do pandas.
Abraços!
The text was updated successfully, but these errors were encountered: