Программирование и научные вычисления на языке Python/§14: различия между версиями

Содержимое удалено Содержимое добавлено
Нет описания правки
Строка 45:
 
==Чтение простого текстового файла==
Код html-файлов по своему виду часто похож на текст большой программы, в которой та информация, которую мы хотим извлечь, захороненапохоронена запод множеством тэгов и довольно скверного синтаксиса. По этой причине извлечение информации именно из html-файла может оказаться довольно непростой задачей. Как эта проблема решается, мы поговорим в следующем пункте. Однако, мир виртуальных численных измерений может иногда оказаться более доступным: данные, что мы ищем, зачастую располагаются в простых txt-файлах, которые можно также, зная URL, загрузить.
 
Например, на сайте [http://www.engr.udayton.edu/weather/citylistWorld.htm] можно для многих городов найти txt-файлы о температурах в различных городах, начиная с 1 января 1995 года по сегодняшний день. Из российских городов мы там обнаруживаем Москву — [http://www.engr.udayton.edu/faculty/jkissock/gsod/RSMOSCOW.txt],. выВы, конечно можете выбрать для себя и любой другой город. В соответствии с URL загружаем мы можем загрузить нужный нам файл:
 
 
Строка 56:
 
 
Если просмотреть этот файл в текстовом редакторе или в том же браузере, мы увидим, что файлон содержит четыре столбца: первый обозначает номер месяца, второй — число, третий — год, четвертый — температуру в градусах Фаренгейта.
 
Как мы можем использовать эти данные в программе? Во-первых, мы должны определиться со структурой хранения данных. Для этих целей неплохо подойдет вложенный словарь в виде <tt>temp[year][month][date]</tt>. Узнаем месяц, потом номер месяца, потом число и получаем соответствующее значение температуры. Процесс конвертирования файла в нашу базу данных заключается в последовательном чтении строк, их разбиении на слова, использовании первых трех слов в качестве ключей и последнего в качестве значения:
Строка 119:
plt.plot(date, temp)
plt.show()</source>
 
 
==Извлечение данных из html==