f = open(fname,'r')
lines = f.readlines()[1:]
['a', 'b', 'c'][1:]
=>['b', 'c']
de more-itertools
como indicado na ? Eu ouvi sobre isso em
Se você deseja a primeira linha e deseja executar alguma operação no arquivo, este código será útil.
with open(filename , 'r') as f:
first_line = f.readline()
for line in f:
# Perform some operations
Se o fatiamento pudesse funcionar em iteradores ...
from itertools import islice
with open(fname) as f:
for line in islice(f, 1, None):
f = open(fname).readlines()
firstLine = f.pop(0) #removes the first line
for line in f:
Para generalizar a tarefa de ler várias linhas de cabeçalho e melhorar a legibilidade, eu usaria a extração de método. Suponha que você queira tokenizar as três primeiras linhas coordinates.txt
para usar como informações de cabeçalho.
Name,Longitude,Latitude,Elevation, Comments
String, Decimal Deg., Decimal Deg., Meters, String
Euler's Town,7.58857,47.559537,0, "Blah"
Faneuil Hall,-71.054773,42.360217,0
Yellowstone National Park,-110.588455,44.427963,0
A extração do método permite especificar o que você deseja fazer com as informações do cabeçalho (neste exemplo, simplesmente tokenizamos as linhas do cabeçalho com base na vírgula e a retornamos como uma lista, mas há espaço para fazer muito mais).
def __readheader(filehandle, numberheaderlines=1):
"""Reads the specified number of lines and returns the comma-delimited
strings on each line as a list"""
for _ in range(numberheaderlines):
yield map(str.strip, filehandle.readline().strip().split(','))
with open('coordinates.txt', 'r') as rh:
# Single header line
#print next(__readheader(rh))
# Multiple header lines
for headerline in __readheader(rh, numberheaderlines=2):
print headerline # Or do other stuff with headerline tokens
['Name', 'Longitude', 'Latitude', 'Elevation', 'Comments']
['String', 'Decimal Deg.', 'Decimal Deg.', 'Meters', 'String']
Se coordinates.txt
contiver outro cabeçalho, basta alterar numberheaderlines
. O melhor de tudo, é claro o que __readheader(rh, numberheaderlines=2)
está fazendo e evitamos a ambiguidade de ter que descobrir ou comentar por que o autor da resposta aceita usa next()
em seu código.
# Open a connection to the file
with open('world_dev_ind.csv') as file:
# Skip the column names
# Initialize an empty dictionary: counts_dict
counts_dict = {}
# Process only the first 1000 rows
for j in range(0, 1000):
# Split the current line into a list: line
line = file.readline().split(',')
# Get the value for the first column: first_col
first_col = line[0]
# If the column value is in the dict, increment its value
if first_col in counts_dict.keys():
counts_dict[first_col] += 1
# Else, add to the dict and set value to 1
counts_dict[first_col] = 1
# Print the resulting dictionary
e armazená-lo como uma variável