Читать книгу: «Программирование на Python с нуля», страница 4

Шрифт:

Pandas – это библиотека для анализа и обработки данных в Python. Она также может быть использована для работы с текстовыми данными, так как предоставляет множество методов для работы со строками, такие как str.contains(), str.replace(), str.split() и многое другое.

Примеры использования:

Регулярные выражения:

import re

text = "Hello, my name is John. I am 25 years old."

#Извлечение числа из текста

age = re.search('\d+', text).group() print(age) # 25

#Замена имени

new_text = re.sub('John', 'Mark', text) print(new_text) # Hello, my name is Mark. I am 25 years old.

Модуль string:

import string

text = " Hello World! "

#Удаление пробелов

text = text.strip() print(text) # Hello World!

#Преобразование в верхний регистр

text = text.upper() print(text) # HELLO WORLD!

#Разделение строки на слова

words = text.split() print(words) # ['HELLO', 'WORLD!']

Pandas:

import pandas as pd

data = {'text': ['Hello, my name is John.', 'I am 25 years old.']} df = pd.DataFrame(data)

#Поиск строки, содержащей слово "name"

result = df[df['text'].str.contains('name')] print(result) # text # 0 Hello, my name is John.

#Замена слова в тексте

df['text'] = df['text'].str.replace('John', 'Mark') print(df) # text # 0 #Hello, my name is Mark. # 1 I am 25 years old.

Как видно из примеров, в Python существует множество инструментов для обработки текста, и выбор конкретного инструмента зависит от задачи, которую необходимо решить.

Модули и библиотеки

В Python модуль – это файл с расширением .py, содержащий код, который может быть импортирован в другие программы. Модуль может содержать функции, классы, переменные и другие объекты Python.

Библиотека – это коллекция модулей, предназначенных для решения определенных задач. В Python есть множество стандартных библиотек, которые поставляются с интерпретатором Python, а также множество сторонних библиотек, которые можно установить с помощью менеджера пакетов.

Стандартные библиотеки Python

Python поставляется со множеством стандартных библиотек, которые предоставляют инструменты для решения различных задач. Некоторые из них:

os – инструменты для работы с операционной системой, такие как создание, удаление и перемещение файлов и директорий.

datetime – инструменты для работы с датами и временем.

math – математические функции, такие как тригонометрические и логарифмические функции.

random – генерация случайных чисел.

json – инструменты для работы с форматом данных JSON.

csv – инструменты для работы с форматом данных CSV.

urllib – инструменты для работы с протоколом HTTP, такие как загрузка веб-страниц и отправка запросов.

Использование сторонних библиотек в Python

Python имеет огромное сообщество разработчиков, которые создают библиотеки для решения различных задач. Чтобы использовать стороннюю библиотеку, необходимо установить ее с помощью менеджера пакетов, такого как pip.

Например, для установки библиотеки numpy, необходимо выполнить следующую команду в терминале:

pip install numpy

После установки библиотеки, ее можно импортировать и использовать в своей программе:

Возрастное ограничение:
0+
Дата выхода на Литрес:
10 мая 2023
Дата написания:
2023
Объем:
10 стр. 1 иллюстрация
Правообладатель:
Автор
Формат скачивания:
Текст
Средний рейтинг 4,2 на основе 21 оценок
По подписке
Текст PDF
Средний рейтинг 4,3 на основе 4 оценок
По подписке
Текст PDF
Средний рейтинг 5 на основе 1 оценок
По подписке
Текст, доступен аудиоформат
Средний рейтинг 4,3 на основе 13 оценок
По подписке
Текст, доступен аудиоформат
Средний рейтинг 4,4 на основе 65 оценок
По подписке
Текст PDF
Средний рейтинг 5 на основе 1 оценок
По подписке
Текст PDF
Средний рейтинг 4 на основе 139 оценок
По подписке
Аудио
Средний рейтинг 3,3 на основе 15 оценок
По подписке
Текст, доступен аудиоформат
Средний рейтинг 3,4 на основе 31 оценок