Maneira simples de importar dados do seu googledrive - economizando tempo para as pessoas (não sei por que o Google simplesmente não lista explicitamente este passo a passo).
INSTALAR E AUTENTICAR PYDRIVE
!pip install -U -q PyDrive ## you will have install for every colab session
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials
# 1. Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
ENVIANDO
se você precisar enviar dados da unidade local:
from google.colab import files
uploaded = files.upload()
for fn in uploaded.keys():
print('User uploaded file "{name}" with length {length} bytes'.format(name=fn, length=len(uploaded[fn])))
execute e isso exibirá um botão de escolha de arquivo - encontre seu arquivo de upload - clique em abrir
Após o upload, ele exibirá:
sample_file.json(text/plain) - 11733 bytes, last modified: x/xx/2018 - %100 done
User uploaded file "sample_file.json" with length 11733 bytes
CRIAR ARQUIVO PARA O NOTEBOOK
Se o seu arquivo de dados já estiver no seu gdrive, você pode pular para esta etapa.
Agora está no seu Google Drive. Encontre o arquivo no seu Google Drive e clique com o botão direito. Clique em obter 'link compartilhável'. Você verá uma janela com:
https://drive.google.com/open?id=29PGh8XCts3mlMP6zRphvnIcbv27boawn
Cópia - '29PGh8XCts3mlMP6zRphvnIcbv27boawn' - esse é o ID do arquivo.
No seu caderno:
json_import = drive.CreateFile({'id':'29PGh8XCts3mlMP6zRphvnIcbv27boawn'})
json_import.GetContentFile('sample.json') - 'sample.json' is the file name that will be accessible in the notebook.
IMPORTAR DADOS NO CADERNO
Para importar os dados que você enviou para o notebook (um arquivo json neste exemplo - como você carrega dependerá do tipo de arquivo / dados - .txt, .csv etc.):
sample_uploaded_data = json.load(open('sample.json'))
Agora você pode imprimir para ver os dados disponíveis:
print(sample_uploaded_data)