5. Nội dung nghiên cứu
3.1.2. Công cụ và thư viện
Sau khi cài đặt Anaconda, chúng ta đã có Python và các gói thư viện và công cụ cần thiết, sau đây chúng ta sẽ tiểu hiểu về một số gói thư viện và công cụ sẽ dùng trong luận văn.
Juputer:
thành Jupyter Notebook. Jupyter hỗ trợ rất nhiều các kernel cho các ngôn ngữ khác nhau, khoảng trên 40 ngôn ngữ trong đó có Python. Việc đổi tên từ IPython sang Jupyter cũng là vì mục đích hỗ trợ đa ngôn ngữ.
Py2neo.
Py2neo là một gói Python cho phép lập trình viên sử dụng sức mạnh
của Neo4j trong Python. Nó hoạt động bằng cách thiết lập kết nối tới Neo4j cho phép lập trình viên thực thi các truy vấn trên cơ sở dữ liệu Neo4j và ghi kết quả vào khung dữ liệu pandas (hoặc các kiểu dữ liệu khác).
Pandas.
Pandas là một thư viện mã nguồn mở, được cấp phép BSD cung cấp
các cấu trúc dữ liệu hiệu suất cao, dễ sử dụng và các công cụ phân tích dữ liệu cho ngôn ngữ lập trình Python và nó được cài đặt khi chúng ta cài Anaconda.
Scikit - learning.
Scikit-learning còn được biết đến với các từ đồng nghĩa như scikits- learn hoặc sklearn. Nó là một thư viện học máy mã nguồn mở miễn phí được sử dụng cho ngôn ngữ lập trình Python. Các tính năng chính của thư viện Scikit-learning bao gồm thuật toán phân loại, hồi quy và phân cụm (hỗ trợ máy vectơ, rừng ngẫu nhiên, tăng độ dốc, K-means và DBSCAN). Sklearn được thiết kế để xử lý các thư viện số và khoa học của Python như NumPy và SciPy.