Last modified: March 08, 2020
This article is written in: 🇵🇱
W Pythonie moduły i pakiety są elementami umożliwiającymi organizację i strukturyzację kodu. Dzięki nim programy stają się bardziej czytelne, łatwiejsze w utrzymaniu i skalowalne. Ułatwiają one zarządzanie dużymi projektami oraz współpracę z innymi programistami. Zrozumienie tych elementów jest niezbędne dla efektywnego programowania i utrzymania czystego, modularnego kodu.
Dzięki modułom i pakietom możemy unikać chaosu w dużych aplikacjach. Wyobraź sobie, że masz jeden bardzo długi plik z setkami funkcji i klas – odszukanie konkretnego fragmentu kodu czy naprawa błędu staje się wtedy dużo trudniejsze. Dzięki podziałowi na mniejsze pliki (moduły) i foldery (pakiety) szybko zidentyfikujesz, w którym miejscu należy wprowadzić zmiany, a cały projekt stanie się przejrzysty. Podzielenie aplikacji na logiczne sekcje (np. część odpowiedzialna za logikę biznesową, część obsługującą operacje na bazie danych itp.) sprawia również, że wielu programistów może jednocześnie pracować nad różnymi częściami aplikacji, zmniejszając ryzyko konfliktów i błędów w kodzie.
Moduł to podstawowy sposób organizacji kodu. Jest to pojedynczy plik z rozszerzeniem .py
, który może zawierać definicje funkcji, klas, zmiennych, a także kod wykonywalny. Moduły pozwalają na podzielenie kodu na mniejsze, logiczne części, co ułatwia zarządzanie i ponowne użycie kodu w innych projektach. Dzięki modułom możemy łatwo organizować nasz kod i unikać powielania funkcji, a także dzielić się nimi z innymi.
W praktyce oznacza to, że jeśli napiszemy kilka uniwersalnych funkcji matematycznych lub moduł obsługujący połączenie z bazą danych, możemy go wielokrotnie wykorzystywać w różnych projektach. Oszczędzamy w ten sposób czas i wysiłek, a także redukujemy ryzyko pojawienia się błędów, które mogłyby wkraść się przy powielaniu kodu.
Przykład prostego modułu:
Utwórz plik o nazwie matematyka.py
z następującą zawartością:
# matematyka.py
def dodaj(a, b):
return a + b
def odejmij(a, b):
return a - b
PI = 3.1415
W tym module:
dodaj(a, b)
- funkcja, która zwraca sumę dwóch liczb.odejmij(a, b)
- funkcja, która zwraca różnicę między dwiema liczbami.PI
- zmienna przechowująca wartość liczby Pi z dokładnością do czterech miejsc po przecinku.Moduł matematyka.py
jest teraz samodzielnym plikiem, który możemy zaimportować do innych skryptów, aby wykorzystać jego funkcje i zmienne.
Warto pamiętać, że moduł może również zawierać kod wykonywalny, który zostanie uruchomiony w momencie importu. Dlatego zwykle oddziela się część z definicjami funkcji czy klas od kodu, który faktycznie coś uruchamia, aby uniknąć niepożądanego działania przy imporcie.
Aby skorzystać z funkcji i zmiennych z modułu matematyka.py
w innym pliku, możemy go zaimportować za pomocą instrukcji import
. Dzięki temu możemy używać wszystkich funkcji i zmiennych, które znajdują się w module, odwołując się do nich przez nazwę modułu.
Importowanie modułu stanowi pierwszy krok do wykorzystania napisanych przez nas lub innych programistów bibliotek. Gdybyśmy mieli powtarzać definicje funkcji w każdym pliku, w którym chcemy ich używać, nasz kod szybko by się rozrósł. Dzięki prostemu import matematyka
otrzymujemy dostęp do wszystkiego, co znajduje się w tym pliku, bez konieczności duplikowania kodu.
Przykład użycia modułu:
# main.py
import matematyka
wynik = matematyka.dodaj(5, 7)
print(wynik) # Output: 12
print(matematyka.PI) # Output: 3.1415
W tym przykładzie:
import matematyka
wczytuje cały moduł matematyka
, co pozwala nam na korzystanie z jego funkcji i zmiennych.dodaj
lub zmiennej PI
, używamy prefiksu matematyka.
.matematyka
.
Dobrą praktyką jest, by nazwa modułu była krótka, opisowa i używała tylko małych liter, co ułatwia korzystanie z niej w dłuższych projektach. Sam import jest wykonywany tylko raz, przy pierwszym odwołaniu do modułu w danym pliku, a Python pamięta go w tzw. sys.modules, co zapobiega wielokrotnemu przeładowywaniu tego samego kodu.
Zamiast importować cały moduł, możemy importować tylko konkretne funkcje lub zmienne, co sprawia, że kod staje się bardziej zwięzły i czytelny. Dzięki temu nie musimy używać prefiksu modułu za każdym razem.
To rozwiązanie sprawdza się szczególnie dobrze, gdy chcemy użyć zaledwie jednej lub dwóch funkcji z dużego modułu. Nie zawsze chcemy obciążać przestrzeni nazw całym zestawem elementów, zwłaszcza jeśli interesuje nas tylko niewielki wycinek funkcjonalności danego modułu.
from matematyka import dodaj, PI
wynik = dodaj(10, 15)
print(wynik) # Output: 25
print(PI) # Output: 3.1415
W tym przypadku:
from matematyka import dodaj, PI
pozwala nam zaimportować tylko wybrane elementy z modułu matematyka
.dodaj
oraz uzyskać dostęp do zmiennej PI
, bez konieczności używania prefiksu matematyka.
.
Jednocześnie warto pamiętać, że taki sposób importowania może spowodować konflikt nazw, jeśli inny moduł lub zmienna w naszym projekcie noszą tę samą nazwę. Wtedy Python nie będzie wiedział, do której definicji się odwołać. Z tego powodu trzeba świadomie zarządzać importami i ewentualnie używać aliasów.
Czasami nazwa modułu lub funkcji może być długa lub może powodować konflikt nazw z innymi elementami w kodzie. W takich przypadkach możemy nadać alias (inną nazwę) modułowi lub funkcji, co ułatwia ich używanie.
Alias pozwala nam skrócić i ujednolicić wywołania, zwłaszcza gdy nazwy modułów są długie bądź mało intuicyjne. Często w bibliotekach naukowych (jak numpy
) stosuje się alias np
, a w pandas – pd
. Dzięki temu kod jest czytelniejszy i zrozumiały dla większości programistów używających tych standardowych aliasów.
Przykład aliasowania modułu:
import matematyka as mat
wynik = mat.odejmij(10, 5)
print(wynik) # Output: 5
Tutaj:
import matematyka as mat
oznacza, że moduł matematyka
jest dostępny pod krótszą nazwą mat
.mat
, co może być bardziej wygodne.Przykład aliasowania funkcji:
from matematyka import dodaj as d
wynik = d(3, 4)
print(wynik) # Output: 7
W tym przypadku:
from matematyka import dodaj as d
pozwala nam zaimportować funkcję dodaj
i przypisać jej nazwę d
.d(3, 4)
, co jest krótsze i może być bardziej czytelne w niektórych kontekstach.
Dzięki aliasowaniu możemy uniknąć niejednoznaczności i sprawić, że kod będzie bardziej zrozumiały dla innych osób, które również z niego korzystają. Z drugiej strony, zbyt częste i nadmierne aliasowanie może utrudnić rozumienie, dlatego warto robić to rozważnie.
.py
– module – a następnie przetestować tylko jego funkcjonalność, co jest szczególnie ważne w przypadku dużych projektów, w których oszczędność czasu odgrywa istotną rolę.
Pakiet to struktura, która umożliwia grupowanie powiązanych modułów w jednym katalogu. Dzięki pakietom możemy organizować kod na wyższym poziomie niż przy użyciu pojedynczych modułów, co jest szczególnie przydatne w większych projektach. Pakiet to po prostu folder, który zawiera moduły (pliki .py
) oraz specjalny plik __init__.py
. Obecność pliku __init__.py
informuje Pythona, że dany folder powinien być traktowany jako pakiet, co pozwala na jego importowanie w innych częściach programu.
Innymi słowy, pakiet to „skrzynka” pełna modułów, pogrupowanych według jakiegoś klucza – na przykład tematycznego (moduły związane z operacjami na liczbach mogą się znaleźć w jednym pakiecie), dzięki czemu łatwiej jest utrzymać porządek w projekcie.
Struktura pakietu:
projekt/
├── kalkulator/
│ ├── __init__.py
│ ├── arytmetyka.py
│ └── geometry.py
└── main.py
kalkulator/
- katalog, który pełni rolę pakietu. Zawiera moduły związane z obliczeniami matematycznymi.__init__.py
- plik specjalny, który sprawia, że Python rozpoznaje katalog kalkulator
jako pakiet. Może być pusty, ale często zawiera kod inicjalizacyjny lub importy.arytmetyka.py
- moduł w pakiecie, który może zawierać funkcje do operacji arytmetycznych (np. dodawanie, odejmowanie).geometry.py
- moduł w pakiecie, który może zawierać funkcje związane z obliczeniami geometrycznymi (np. pole powierzchni, obwód).Kluczową różnicą między pakietem a zwykłym katalogiem jest obecność pliku __init__.py
. Jego rola polega na zdefiniowaniu pewnych informacji na temat pakietu oraz (w razie potrzeby) na wykonaniu kodu inicjalizującego, gdy pakiet zostanie zaimportowany.
Aby utworzyć pakiet, wykonaj następujące kroki:
I. Stwórz folder o nazwie pakietu - np. kalkulator
, który będzie zawierał wszystkie moduły powiązane z tym pakietem.
II. Utwórz plik __init__.py
wewnątrz katalogu - może być pusty lub zawierać kod, który będzie wykonywany podczas importowania pakietu.
III. Dodaj moduły (pliki .py
) do katalogu pakietu - umieść tam pliki, takie jak arytmetyka.py
czy geometry.py
.
Tak utworzony pakiet może być zaimportowany w naszym głównym pliku Pythona lub w innym module, co pozwala na wygodne korzystanie z jego zawartości. W ten sposób struktura projektu pozostaje logicznie podzielona na mniejsze, wyspecjalizowane obszary.
Przykład modułu w pakiecie:
W pliku arytmetyka.py
możemy zdefiniować podstawowe operacje matematyczne:
## arytmetyka.py
def dodaj(a, b):
return a + b
def odejmij(a, b):
return a - b
W tym przykładzie:
dodaj(a, b)
zwraca sumę dwóch liczb.odejmij(a, b)
zwraca różnicę między dwiema liczbami.arytmetyka.py
może być zaimportowany do innych części projektu, aby korzystać z tych funkcji.W ramach tego samego pakietu można utworzyć wiele modułów, z których każdy odpowiada za inny obszar funkcjonalny, np. geometry.py
dla obliczeń geometrycznych czy wyrazenia.py
dla obsługi bardziej skomplikowanych wyrażeń matematycznych.
Aby skorzystać z funkcji i klas zawartych w modułach pakietu, używamy notacji kropkowej (.
). Możemy zaimportować cały moduł z pakietu, a następnie odwoływać się do jego zawartości za pomocą prefiksu modułu.
Przykład importowania modułu z pakietu:
# main.py
from kalkulator import arytmetyka
wynik = arytmetyka.dodaj(2, 3)
print(wynik) # Output: 5
W tym przykładzie:
from kalkulator import arytmetyka
importuje moduł arytmetyka
z pakietu kalkulator
.dodaj
z modułu arytmetyka
używając notacji arytmetyka.dodaj
.Dzięki temu rozwiązaniu możliwe jest budowanie rozbudowanych projektów, w których moduły są pogrupowane w pakiety, a pakiety mogą być nawet wielopoziomowe. W praktyce oznacza to, że w katalogu kalkulator
może znajdować się kolejny folder (kolejny pakiet) – i tak dalej.
Jeżeli chcemy zaimportować tylko wybrane funkcje lub klasy z modułu, możemy to zrobić bezpośrednio, co sprawia, że kod staje się bardziej zwięzły.
Przykład:
from kalkulator.arytmetyka import odejmij
wynik = odejmij(10, 4)
print(wynik) # Output: 6
W tym przypadku:
from kalkulator.arytmetyka import odejmij
importuje tylko funkcję odejmij
z modułu arytmetyka
w pakiecie kalkulator
.odejmij
bez potrzeby używania prefiksu arytmetyka.
.Taka elastyczność w sposobie importowania ma szczególne znaczenie w dużych projektach, gdzie chcemy ograniczyć zasób ładowanych do pamięci elementów tylko do tych naprawdę potrzebnych. Pozwala to również uniknąć niepotrzebnych konfliktów nazw z elementami, które nas w danej chwili nie interesują.
__init__.py
Plik __init__.py
w pakiecie pełni kilka ważnych funkcji:
__all__
, możemy kontrolować, które moduły są importowane, gdy ktoś użyje from pakiet import *
.__all__
. Dzięki temu łatwiej kontrolować, co finalnie będzie dostępne dla użytkowników naszego kodu.
Przykład __init__.py
:
# __init__.py
__all__ = ['arytmetyka', 'geometry']
Dzięki powyższemu ustawieniu:
from kalkulator import *
, zaimportowane zostaną tylko moduły arytmetyka
i geometry
.__all__
, nie zostaną automatycznie zaimportowane, co pomaga w zarządzaniu widocznością zawartości pakietu.Przykład użycia from pakiet import *
:
# main.py
from kalkulator import *
wynik = arytmetyka.dodaj(5, 5)
print(wynik) # Output: 10
W tym przypadku:
from kalkulator import *
zaimportuje moduły arytmetyka
i geometry
, ponieważ są one wymienione w __all__
pliku __init__.py
.from pakiet import *
nie zawsze jest zalecany, zwłaszcza w większych projektach. Może to skutkować niejasnościami co do tego, skąd pochodzi dana funkcja, i prowadzić do konfliktów nazw. Z drugiej strony, w małych projektach lub w środowiskach interaktywnych (REPL
, Jupyter Notebook) takie podejście może być wygodne podczas szybkiego prototypowania.
Importowanie modułów i pakietów w Pythonie jest kluczowe dla efektywnego zarządzania przestrzenią nazw i unikania duplikacji kodu. Oto różne metody importowania:
Pozwala to na dostęp do wszystkich funkcji, klas i zmiennych w module, używając notacji z kropką.
Przykład:
import os
current_directory = os.getcwd()
print(current_directory)
Jest to jedna z najczęstszych praktyk, gdyż pozwala na szybkie korzystanie z całego modułu, o ile nazwa modułu nie jest zbyt długa ani nieintuicyjna. W Pythonie standardowym takie nazwy (np. os
, sys
) są krótkie i dobrze opisują swoje przeznaczenie.
Umożliwia korzystanie z krótszej nazwy modułu w kodzie.
Przykład:
import numpy as np
array = np.array([1, 2, 3])
print(array)
Tego typu aliasowanie jest często spotykane w społeczności naukowej, gdzie standardem są aliasy takie jak: import numpy as np
, import pandas as pd
, import matplotlib.pyplot as plt
. Dzięki temu kody są nie tylko krótsze, ale i bardziej spójne pomiędzy różnymi projektami.
Importuje tylko określone funkcje lub klasy.
Przykład:
from math import sqrt, pi
print(sqrt(16)) # Output: 4.0
print(pi) # Output: 3.141592653589793
To podejście pomaga uniknąć „zaśmiecania” przestrzeni nazw niepotrzebnymi elementami i sprawia, że od razu widać, jakie konkretnie funkcje czy obiekty są nam potrzebne. Jest to też często praktykowane w krótkich skryptach, w których wielokrotnie używamy tylko jednej czy dwóch funkcji z całego modułu.
Pozwala na zmianę nazwy importowanej funkcji.
Przykład:
from math import factorial as fac
print(fac(5)) # Output: 120
Aliasowanie funkcji może znacząco skrócić wywołania i poprawić czytelność kodu – zwłaszcza gdy pracujemy w zespołach, w których określone skróty są umowami między programistami. Jest to też sposób na uniknięcie konfliktów nazw z innymi elementami w naszym programie.
Importuje wszystkie publiczne elementy modułu.
Przykład:
from random import *
print(randint(1, 10))
Uwaga: Ta metoda może prowadzić do konfliktów nazw i jest ogólnie odradzana.
Chociaż jest ona kusząca, szczególnie w przypadku szybkich eksperymentów (np. w trybie interaktywnym), w dużych projektach może powodować wiele niejasności. W takiej sytuacji nie wiadomo, czy dana funkcja randint
pochodzi z modułu random
, czy została zdefiniowana lokalnie w innym miejscu naszego kodu. Dlatego stosowanie import *
powinno być rozważne i zwykle ograniczone do sytuacji prototypowania lub niewielkich projektów.
W Pythonie kod znajdujący się poza definicjami funkcji i klas w module jest wykonywany natychmiast podczas importowania tego modułu. Oznacza to, że jeśli w module znajdują się instrukcje, które nie są umieszczone w funkcjach lub klasach, zostaną one wykonane, gdy tylko zaimportujemy moduł w innym pliku. Może to prowadzić do nieoczekiwanych efektów, takich jak wywoływanie funkcji lub drukowanie komunikatów, których nie planowaliśmy podczas importu.
Przykład problematycznego modułu:
Załóżmy, że mamy moduł misja.py
z następującą zawartością:
## misja.py
def przygotuj_misje():
print("Przygotowanie misji...")
def start_misji():
print("Start misji!")
start_misji() ## Ta funkcja zostanie wywołana podczas importowania
W tym przykładzie:
start_misji()
jest wywoływana bezpośrednio w module, poza definicjami funkcji.Jeśli teraz zaimportujemy moduł misja
w innym pliku:
import misja
To w konsoli zostanie wyświetlone:
Start misji!
Dzieje się tak dlatego, że Python wykonuje kod umieszczony poza definicjami funkcji natychmiast podczas importowania modułu. W tym przypadku nie chcieliśmy, aby funkcja start_misji()
została uruchomiona podczas importu — powinna być wywoływana tylko wtedy, gdy rzeczywiście tego chcemy.
Aby uniknąć niechcianego wykonywania kodu podczas importowania, używamy konstrukcji:
if __name__ == "__main__":
## Kod, który zostanie wykonany tylko przy bezpośrednim uruchomieniu modułu
Dzięki tej konstrukcji możemy określić, które fragmenty kodu mają być uruchamiane tylko wtedy, gdy moduł jest uruchamiany jako główny program, a nie podczas jego importowania.
## misja.py
def przygotuj_misje():
print("Przygotowanie misji...")
def start_misji():
print("Start misji!")
if __name__ == "__main__":
start_misji()
W tym przykładzie:
if __name__ == "__main__":
sprawia, że funkcja start_misji()
zostanie uruchomiona tylko wtedy, gdy moduł misja.py
zostanie uruchomiony bezpośrednio jako skrypt, a nie podczas importowania go w innym pliku.misja
w innym pliku, funkcja start_misji()
nie zostanie wywołana automatycznie, co eliminuje niepożądane efekty.if __name__ == "__main__":
__name__
: To specjalna zmienna, która jest automatycznie ustawiana przez Pythona. Jej wartość zależy od tego, w jaki sposób uruchamiany jest moduł:python misja.py
), wówczas __name__
przyjmuje wartość "__main__"
.__name__
przyjmuje nazwę tego modułu (np. "misja"
).if __name__ == "__main__":
umożliwia nam określenie, które fragmenty kodu mają być uruchamiane tylko wtedy, gdy moduł jest uruchamiany bezpośrednio jako skrypt. Pozwala to na oddzielenie kodu testowego lub przykładów użycia od kodu, który powinien być dostępny po zaimportowaniu modułu.Przykład zastosowania:
## narzedzia.py
def testuj_funkcje():
print("Testowanie funkcji...")
if __name__ == "__main__":
testuj_funkcje()
W tym module:
testuj_funkcje()
zostanie wywołana tylko wtedy, gdy uruchomimy skrypt narzedzia.py
bezpośrednio z linii poleceń.narzedzia.py
jest importowane w innym skrypcie, kod w bloku if __name__ == "__main__":
nie zostanie wykonany.narzedzia.py
bezpośrednio:Jeśli uruchomimy plik narzedzia.py
bezpośrednio z linii poleceń:
python narzedzia.py
To na wyjściu zobaczymy:
Testowanie funkcji...
Ponieważ w tym przypadku __name__
przyjmuje wartość "__main__"
, kod w bloku if __name__ == "__main__":
zostaje wykonany.
narzedzia.py
w innym pliku:Jeśli zaimportujemy narzedzia.py
w innym pliku:
# main.py
import narzedzia
Nie zobaczymy żadnego komunikatu w konsoli, ponieważ kod w bloku if __name__ == "__main__":
nie zostanie wykonany — __name__
w module narzedzia
nie ma wartości "__main__"
podczas importu.
W Pythonie możemy importować moduły i funkcje na dwa główne sposoby: za pomocą importów absolutnych oraz względnych. Obie metody mają swoje zastosowania i są wybierane w zależności od struktury projektu oraz potrzeb programisty.
Importy absolutne odwołują się do modułów, używając ich pełnej ścieżki, poczynając od katalogu głównego projektu. Oznacza to, że określamy dokładnie, skąd ma pochodzić importowany moduł, bez względu na to, w którym miejscu struktury katalogów znajduje się plik, który wykonuje import.
Przykład importu absolutnego:
from kalkulator.arytmetyka import dodaj
W tym przykładzie:
from kalkulator.arytmetyka import dodaj
wskazuje, że funkcja dodaj
powinna zostać zaimportowana z modułu arytmetyka
, który znajduje się w pakiecie kalkulator
.arytmetyka
jest podana w sposób pełny, poczynając od katalogu kalkulator
.Zaletą importów absolutnych jest to, że są one jasne i czytelne – widać dokładnie, z którego modułu pochodzi import. Dzięki temu łatwiej jest zrozumieć strukturę projektu, zwłaszcza gdy jest on duży i zawiera wiele pakietów.
Importy względne odwołują się do modułów na podstawie ich położenia względem bieżącego modułu, w którym wykonujemy import. Są przydatne, gdy chcemy odwołać się do modułów, które znajdują się w tym samym pakiecie lub w pokrewnych pakietach. W przypadku importów względnych używamy kropek (.
) do wskazania położenia modułów:
.
) odnosi się do bieżącego pakietu...
) odnoszą się do jednego poziomu wyżej, czyli do pakietu nadrzędnego.Przykład importu względnego:
from .arytmetyka import dodaj ## Importuje funkcję dodaj z modułu arytmetyka w bieżącym pakiecie
W tym przykładzie:
from .arytmetyka import dodaj
wskazuje, że funkcja dodaj
jest importowana z modułu arytmetyka
, który znajduje się w tym samym pakiecie co bieżący plik..
) sprawia, że odwołujemy się do modułu arytmetyka
w ramach tego samego pakietu.Importy względne są szczególnie przydatne w dużych projektach, w których moduły są zorganizowane w hierarchiczne struktury pakietów. Pozwalają one na łatwe przenoszenie całych pakietów bez konieczności zmieniania ścieżek importu, co ułatwia refaktoryzację kodu.
python skrypt.py
). W takim przypadku Python nie wie, w jakim kontekście należy interpretować kropki w importach względnych.Jeżeli mamy strukturę katalogów:
projekt/
├── kalkulator/
│ ├── __init__.py
│ ├── arytmetyka.py
│ └── geometry.py
└── main.py
i w pliku arytmetyka.py
znajduje się import względny:
## arytmetyka.py
from .geometry import oblicz_pole
To ten import będzie działał, gdy arytmetyka.py
zostanie zaimportowany jako część pakietu kalkulator
, na przykład w main.py
:
# main.py
from kalkulator import arytmetyka
Ale jeśli spróbujemy uruchomić arytmetyka.py
bezpośrednio:
python kalkulator/arytmetyka.py
otrzymamy błąd, ponieważ importy względne nie działają, gdy plik jest uruchamiany bezpośrednio.
Importy absolutne:
Importy względne:
from modul import *
, aby zapobiec konfliktom nazw i poprawić czytelność kodu.analiza_danych
W poniższym przykładzie tworzymy pakiet analiza_danych
, który będzie zawierał moduły odpowiedzialne za różne etapy analizy danych.
Struktura pakietu:
projekt/
├── analiza_danych/
│ ├── __init__.py
│ ├── wczytywanie.py
│ ├── przetwarzanie.py
│ └── wizualizacja.py
└── main.py
analiza_danych/
- katalog, który jest traktowany jako pakiet w Pythonie. W nim znajdują się wszystkie pliki odpowiadające za różne funkcjonalności.__init__.py
- plik, który pozwala traktować katalog analiza_danych
jako pakiet. Zawiera on importy z modułów wewnątrz pakietu.wczytywanie.py
- moduł odpowiedzialny za wczytywanie danych.przetwarzanie.py
- moduł, w którym są zawarte funkcje przetwarzające dane (np. filtrowanie, agregacja).wizualizacja.py
- moduł zajmujący się tworzeniem wykresów i wizualizacją wyników.main.py
- główny skrypt, który korzysta z funkcji dostępnych w pakiecie analiza_danych
.wczytywanie.py
def wczytaj_csv(sciezka):
## Kod do wczytywania pliku CSV
pass
W module wczytywanie.py
znajduje się funkcja wczytaj_csv
, która przyjmuje argument sciezka
, czyli ścieżkę do pliku CSV, który chcemy wczytać. Ta funkcja mogłaby używać bibliotek takich jak pandas
, aby załadować dane z pliku do DataFrame'a:
import pandas as pd
def wczytaj_csv(sciezka):
return pd.read_csv(sciezka)
Powyższy kod wczytuje dane z pliku CSV i zwraca je w postaci DataFrame, co jest bardzo wygodne przy dalszej analizie danych.
przetwarzanie.py
def filtruj_dane(dane):
## Kod do filtrowania danych
pass
Funkcja filtruj_dane
w module przetwarzanie.py
zajmuje się przetwarzaniem danych. Jako argument przyjmuje dane
, które mogą być np. DataFrame'em wczytanym wcześniej. Przykładowo, możemy chcieć odfiltrować dane na podstawie pewnych warunków:
def filtruj_dane(dane, kolumna, wartosc):
return dane[dane[kolumna] > wartosc]
W tym przykładzie funkcja filtruje wiersze, w których wartość w danej kolumnie jest większa od podanej wartości. Dzięki temu możemy łatwo wybrać tylko te dane, które spełniają określone kryteria.
wizualizacja.py
def wykres_liniowy(dane):
## Kod do tworzenia wykresu liniowego
pass
Moduł wizualizacja.py
zawiera funkcję wykres_liniowy
, która tworzy wykresy na podstawie dostarczonych danych. Zwykle takie wykresy są generowane za pomocą bibliotek takich jak matplotlib
lub seaborn
:
import matplotlib.pyplot as plt
def wykres_liniowy(dane, x, y):
plt.figure(figsize=(10, 6))
plt.plot(dane[x], dane[y], marker='o')
plt.title('Wykres Liniowy')
plt.xlabel(x)
plt.ylabel(y)
plt.grid(True)
plt.show()
W powyższym kodzie funkcja wykres_liniowy
rysuje wykres, gdzie x
i y
to nazwy kolumn, które mają być użyte do osi X i Y. Wykres zostanie wyświetlony za pomocą matplotlib
.
__init__.py
from .wczytywanie import wczytaj_csv
from .przetwarzanie import filtruj_dane
from .wizualizacja import wykres_liniowy
__all__ = ['wczytaj_csv', 'filtruj_dane', 'wykres_liniowy']
Plik __init__.py
pozwala na łatwy dostęp do funkcji pakietu analiza_danych
z zewnątrz. Importując te funkcje wewnątrz __init__.py
, możemy je potem bezpośrednio zaimportować w innych plikach, takich jak main.py
. __all__
definiuje listę funkcji, które są dostępne do importu z poziomu pakietu.
main.py
from analiza_danych import wczytaj_csv, filtruj_dane, wykres_liniowy
dane = wczytaj_csv('dane.csv')
dane_przefiltrowane = filtruj_dane(dane, 'kolumna', 100)
wykres_liniowy(dane_przefiltrowane, 'czas', 'wartość')
W pliku main.py
importujemy funkcje wczytaj_csv
, filtruj_dane
i wykres_liniowy
z pakietu analiza_danych
i używamy ich do przetworzenia danych.
wczytaj_csv
ładuje dane z pliku dane.csv
do DataFrame'a.filtruj_dane
przefiltrowuje dane, wybierając tylko te, gdzie wartość w kolumnie 'kolumna'
jest większa niż 100.wykres_liniowy
generuje wykres liniowy, pokazując zależność między kolumnami 'czas'
i 'wartość'
.