一.文件操作三部曲:
1.打开:
f = open('文件名')
文件名后不加任何时,默认是r以只读的方法打开
r:只能读,不能写。读取文件不存在时会报错
r+:可读,可写。读取文件不存在时会报错
w:只能写,不能读。文件存在时,会清空文件覆盖文件内容;文件不存在时,会新建文件。
w+:可写,可读。文件存在时,会清空文件覆盖文件内容;文件不存在时,会新建文件。
a:只能写,不能读。文件存在时,不会清空文件内容;文件不存在时,新建文件不报错。
a+:可写,可读。文件存在时,不会清空文件内容;文件不存在时,新建文件不报错。
2.操作:
读:content = f.read()
##read()读取整个文件
##readline()只读取一行
print content
写:f.write('写入内容')
3.关闭:
f.close()
vcmV2ZXJfeWg=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70″ />
二.文件指针:
文件指针标记从哪个位置开始读取数据
第一次打开文件时,通常文件指针会指向文件的开始位置,当执行了read方法后,文件指针会移动到读取内容的末尾(文件指针指到了文件的最后一行,就读取不到文件的内容)。
三.读取大型文件时:
因为不知道循环的条件,不知道文件到底有多少行,所以要设定为无限循环while True
#每行结尾有一个n,也被读取
例:
file = open('passwd')
while True:
text = file.readline()
if not text:
break
print text
file.close()
四.读取二进制文件时:
文件打开方式对应为'r' –> mode='rb'
例:
f1 = open('hello.jpg', mode='rb')
f2 = open('happy.jpg', mode='wb')
content = f1.read()
f2.write(content)
f1.close()
f2.close()
练习示例:
1.创建文件data.txt,文件共10行,每行存放一个1—100之间的整数
import random
f = open('data.text','w+')
for i in range(10):
content = f.read()
a = random.randint(1, 100)
f.write('%dn' % a)
print content
f.close()
2.1).生成一个大文件ips.txt,要求1200行,每行随机为172.25.254.0/24段的ip
2).读取ips.txt文件统计这个文件中ip出现频率排前十的ip
import random
def new_file(fileName):
file = open(fileName, 'w+')
content = file.read()
for i in range(1200):
a = random.randint(1, 254)
file.write('172.25.254.%d' % a +'n')
print content
file.close()
def top_ten_ip(filename,count = 10):
ips_dict = dict()
with open(filename) as file:
for ip in file:
if ip in ips_dict:
ips_dict[ip] += 1
else:
ips_dict[ip] = 1
sorted_ip = sorted(ips_dict.items(),key=lambda x:x[1],reverse=True)[:count]
return sorted_ip
input = raw_input('请输入文件名:')
new_file(input)
print top_ten_ip(input)