Читать книгу: «Программирование на Python с нуля», страница 4
Pandas – это библиотека для анализа и обработки данных в Python. Она также может быть использована для работы с текстовыми данными, так как предоставляет множество методов для работы со строками, такие как str.contains(), str.replace(), str.split() и многое другое.
Примеры использования:
Регулярные выражения:
import re
text = "Hello, my name is John. I am 25 years old."
#Извлечение числа из текста
age = re.search('\d+', text).group() print(age) # 25
#Замена имени
new_text = re.sub('John', 'Mark', text) print(new_text) # Hello, my name is Mark. I am 25 years old.
Модуль string:
import string
text = " Hello World! "
#Удаление пробелов
text = text.strip() print(text) # Hello World!
#Преобразование в верхний регистр
text = text.upper() print(text) # HELLO WORLD!
#Разделение строки на слова
words = text.split() print(words) # ['HELLO', 'WORLD!']
Pandas:
import pandas as pd
data = {'text': ['Hello, my name is John.', 'I am 25 years old.']} df = pd.DataFrame(data)
#Поиск строки, содержащей слово "name"
result = df[df['text'].str.contains('name')] print(result) # text # 0 Hello, my name is John.
#Замена слова в тексте
df['text'] = df['text'].str.replace('John', 'Mark') print(df) # text # 0 #Hello, my name is Mark. # 1 I am 25 years old.
Как видно из примеров, в Python существует множество инструментов для обработки текста, и выбор конкретного инструмента зависит от задачи, которую необходимо решить.
Модули и библиотеки
В Python модуль – это файл с расширением .py, содержащий код, который может быть импортирован в другие программы. Модуль может содержать функции, классы, переменные и другие объекты Python.
Библиотека – это коллекция модулей, предназначенных для решения определенных задач. В Python есть множество стандартных библиотек, которые поставляются с интерпретатором Python, а также множество сторонних библиотек, которые можно установить с помощью менеджера пакетов.
Стандартные библиотеки Python
Python поставляется со множеством стандартных библиотек, которые предоставляют инструменты для решения различных задач. Некоторые из них:
os – инструменты для работы с операционной системой, такие как создание, удаление и перемещение файлов и директорий.
datetime – инструменты для работы с датами и временем.
math – математические функции, такие как тригонометрические и логарифмические функции.
random – генерация случайных чисел.
json – инструменты для работы с форматом данных JSON.
csv – инструменты для работы с форматом данных CSV.
urllib – инструменты для работы с протоколом HTTP, такие как загрузка веб-страниц и отправка запросов.
Использование сторонних библиотек в Python
Python имеет огромное сообщество разработчиков, которые создают библиотеки для решения различных задач. Чтобы использовать стороннюю библиотеку, необходимо установить ее с помощью менеджера пакетов, такого как pip.
Например, для установки библиотеки numpy, необходимо выполнить следующую команду в терминале:
pip install numpy
После установки библиотеки, ее можно импортировать и использовать в своей программе: