Программирование и научные вычисления на языке Python/§14: различия между версиями

Содержимое удалено Содержимое добавлено
Нет описания правки
Нет описания правки
Строка 46:
==Чтение простого текстового файла==
Код html-файлов по своему виду часто похож на текст большой программы, в которой та информация, которую мы хотим извлечь захоронена за множеством тэгов и довольно скверного синтаксиса. По этой причине извлечение информации именно из html-файла может оказаться довольно непростой задачей. Как эта проблема решается, мы поговорим в следующем пункте. Однако, мир виртуальных численных измерений может иногда оказаться более доступным: данные, что мы ищем, зачастую располагаются в простых txt-файлах, которые можно также, зная URL, загрузить.
 
Например, на сайте [http://www.engr.udayton.edu/weather/citylistWorld.htm] можно для многих городов найти txt-файлы о температурах в различных городах, начиная с 1 января 1995 года по сегодняшний день. Из российских городов мы там обнаруживаем Москву — [http://www.engr.udayton.edu/faculty/jkissock/gsod/RSMOSCOW.txt], вы, конечно можете выбрать для себя и любой другой город. В соответствии с URL загружаем мы можем загрузить нужный нам файл:
 
 
<source lang="python">
import urllib
url = 'http://www.engr.udayton.edu/faculty/jkissock/gsod/RSMOSCOW.txt'
urllib.urlretrieve(url, filename='Moscow.txt')</source>
 
 
Если просмотреть этот файл в текстовом редакторе или в том же браузере, мы увидим, что файл содержит четыре столбца: первый обозначает номер месяца, второй — число, третий — год, четвертый — температуру в градусах Фаренгейта.