Chính vì lý do này, nhóm tác giả quyết định sử dụng một trong những thành tựu của cuộc cách mạng 4.0 - Big Data với đặc tính có nhiều trường cung cấp lượng dữ liệu lớn được thu thập từ n
CƠ SỞ LÝ THUYẾT
Tổng quan về Big Data
Big Data là tập hợp dữ liệu lớn, đa dạng và phức tạp, bao gồm cả dữ liệu cấu trúc và phi cấu trúc, mà các công nghệ truyền thống không thể xử lý hiệu quả trong thời gian ngắn Mặc dù không có định nghĩa chính xác về kích thước của Big Data, nhưng thường được coi là dữ liệu khi đạt ngưỡng vài Petabyte Để hiểu rõ hơn về quy mô khổng lồ của Big Data, hãy xem xét một số ví dụ cụ thể.
Thông thường đối với phần mềm Word:
Một quyển sách dày 500 trang có độ dày khoảng 5cm tương đương với 1PB dữ liệu, sẽ tạo thành một quyển sách khổ A4 dày tới 300.000 Km, vượt quá một nửa khoảng cách từ Trái Đất đến Mặt Trăng.
Việc khai thác lượng dữ liệu khổng lồ sẽ giúp cuộc sống của chúng ta trở nên đơn giản và hiện đại hơn Thay vì phải tìm kiếm một từ khóa trong 1.000 trang sách, công nghệ hiện đại cho phép chúng ta tìm kiếm dễ dàng trong 3.000 tỷ trang Sự áp dụng công nghệ trong việc xử lý dữ liệu không chỉ nâng cao hiệu suất công việc mà còn mở ra nhiều cơ hội mới trong cuộc sống.
Big Data không chỉ giúp phân tích thói quen mua sắm của khách hàng mà còn mở ra những khả năng chưa từng được nghĩ đến Ví dụ, khi phân tích dữ liệu lớn, người ta nhận thấy rằng phụ nữ thường mua chảo và dầu ăn, trong khi nam giới có xu hướng chọn dao cạo râu và sữa rửa mặt Điều này dẫn đến việc sắp xếp các sản phẩm này gần nhau để tạo sự tiện lợi và kích thích mua sắm Hơn nữa, một giả thuyết thú vị về sinh trắc vân tay được đưa ra, cho thấy việc theo dõi hành vi người dùng có thể giúp xác định sở thích và thói quen của họ dựa trên loại dấu vân tay Như vậy, Big Data có thể đánh giá được năng lực và sở trường của mỗi cá nhân thông qua các đặc điểm sinh trắc học.
Big Data mang lại tiềm năng to lớn nhờ vào khối lượng dữ liệu khổng lồ, có thể được ứng dụng trong nhiều lĩnh vực khác nhau, bao gồm giáo dục, y tế, ngân hàng và hải quan.
Big Data là quá trình phân tích khối lượng dữ liệu lớn nhằm khai thác và tối ưu hóa giá trị hữu ích từ chúng.
Tầm quan trọng của Big Data trong quản lý Hải quan
Tầm quan trọng của Big Data không chỉ nằm ở khối lượng dữ liệu khổng lồ mà còn ở cách chúng ta khai thác và sử dụng dữ liệu đó Chúng ta có thể phân tích dữ liệu để tìm ra giải pháp cho các vấn đề liên quan đến Hải quan, như giảm chi phí và thời gian, dự đoán thời gian vận chuyển tàu biển, tối ưu hóa dịch vụ, đưa ra quyết định thông minh và tính toán rủi ro liên quan đến gian lận.
Tiêu chí Dữ liệu truyền thống Big Data
Dung lượng GB TB, PB
Tốc độ hình thành Mỗi giờ, ngày Mỗi phút, giây
Cấu trúc Có cấu trúc Bán cấu trúc, phi cấu trúc
Nguồn dữ liệu Tập trung Phân phối đầy đủ
Tích hợp dữ liệu Dễ Khó
Kho dữ liệu RDBMS HDFS, NoSQL
Truy cập tương tác Theo lô Gần thời gian thực
Bảng 1.1.1 Sự khác nhau giữa Big Data và dữ liệu truyền thống (theo Hu et al., 2014)
Sự khác biệt chính giữa Big Data và dữ liệu truyền thống nằm ở khối lượng thông tin lớn hơn và tốc độ hình thành gần thời gian thực, cho phép dòng chảy dữ liệu liên tục mà không qua các lô (theo Wu et al., 2014) Ngoài ra, việc xử lý Big Data phức tạp hơn do dữ liệu không được tổ chức, khó sử dụng và phân tán ở nhiều vị trí Vì vậy, việc tích hợp và lưu trữ dữ liệu lớn đòi hỏi các kỹ thuật tiên tiến hơn.
1.1.2 Các cách phân tích Big Data:
Big Data giúp cải thiện độ tin cậy trong quá trình ra quyết định và nâng cao năng suất của các tổ chức Điều này có thể đạt được thông qua việc áp dụng các phương pháp phân tích tiên tiến nhằm khai thác ý nghĩa từ dữ liệu.
Descriptive Analytics (Phân tích mô tả): phân tích dữ liệu để mô tả hoặc xác định những gì được đại diện bởi tập dữ liệu
Phân tích tìm hiểu (Inquisitive Analytics) là phương pháp phân tích dữ liệu nhằm xác minh hoặc bác bỏ một giả thuyết cụ thể Loại phân tích này giúp đưa ra kết luận rõ ràng về tính đúng đắn của các đề xuất.
Predictive Analytics (Phân tích dự đoán): liên quan đến dự báo và mô hình thống kê để xác định các khả năng trong tương lai
Prescriptive Analytics (Phân tích đề xuất): nó là về tối ưu hóa và thử nghiệm ngẫu nhiên để đưa ra lời khuyên về một vấn đề nhất định
Pre-emptive Analytics (Phân tích ưu tiên): là phân tích dữ liệu nhằm đưa ra các hành động phòng ngừa trước các tình huống tiêu cực
Hình 1.1.2 Sơ đồ phân loại các loại phương pháp phân tích Big Data theo (theo Sivarajah et al, 2016)
Phân tích mô tả (Descriptive Analytics) là dạng phân tích đơn giản nhất trong Big Data, tập trung vào việc tóm tắt và mô tả các mẫu kiến thức thông qua các phương pháp thống kê như giá trị trung bình, trung vị, chế độ và độ lệch chuẩn Nó bao gồm báo cáo, trang tổng quan, bảng điểm cân bằng và trực quan hóa dữ liệu, nhằm giải thích một tập dữ liệu Trong kinh doanh, phân tích mô tả giúp theo dõi quy trình theo thời gian bằng cách thiết lập các số liệu giám sát, cho phép xem xét ngược lại và dự đoán những gì đã xảy ra Hầu hết các kỹ thuật phân tích Big Data đều mang tính mô tả và sử dụng các phương pháp thống kê mô tả hay còn gọi là công cụ khai thác dữ liệu.
Phân tích dự đoán (Predictive Analytics) tập trung vào việc dự báo và xác định khả năng trong tương lai thông qua mô hình thống kê Các kỹ thuật này sử dụng phương pháp thống kê tiên tiến để khám phá các mẫu và mối quan hệ giữa các dữ liệu Gandomi và Haider (2015) đã liên kết các kỹ thuật dự đoán với hồi quy và xu hướng mới trong phân tích Machine Learning, vì cả hai đều nhằm mục đích dự đoán tương lai bằng cách phân tích dữ liệu hiện tại và lịch sử.
Phân tích đề xuất (Prescriptive Analytics) nghiên cứu các mối quan hệ nguyên nhân - kết quả nhằm đưa ra những lời khuyên cho nhiều vấn đề khác nhau Phương pháp này thường được áp dụng trong các lĩnh vực tối ưu hóa và ra quyết định.
Hình 1.1.3 Các phương pháp phân tích Big Data theo độ phức tạp và giá trị nó mang lại (theo Gartner, 2017)
1.1.3 Chuỗi giá trị phân tích Big Data:
Chuỗi giá trị cho phân tích Big Data bao gồm bốn giai đoạn chính: tạo, thu thập, lưu trữ và phân tích, mỗi giai đoạn liên kết với các công nghệ hàng đầu trong lĩnh vực này Bài viết này sẽ tập trung vào hai khái niệm quan trọng: phân tích Big Data và web-crawling, nhằm làm rõ cách thức thu thập và xử lý dữ liệu hiệu quả.
Hình 1.1.4 Sơ đồ chuỗi giá trị phân tích Big Data (theo Hu et al., 2014)
Hệ thống Big Data thường được chia thành bốn giai đoạn chính: tạo dữ liệu, thu thập dữ liệu, lưu trữ dữ liệu và phân tích dữ liệu Mặc dù không có giai đoạn trực quan hóa dữ liệu riêng biệt, nhưng nó được xem là một phần của giai đoạn phân tích dữ liệu Trong một số khuôn khổ khác, trực quan hóa dữ liệu lại được coi là một giai đoạn độc lập.
Giai đoạn đầu tiên là generation (tạo dữ liệu), giai đoạn này chỉ đơn giản là tìm hiểu quan tâm về cách mà dữ liệu được tạo ra
Một công cụ hỗ trợ cho công tác quản lý rủi ro - Trình thu thập thông
Trình thu thập thông tin web, hay còn gọi là robot web, là phần mềm tự động duyệt qua World Wide Web một cách có hệ thống Mục đích chính của nó là thu thập và sắp xếp các trang web để các công cụ tìm kiếm như Google có thể truy cập nội dung nhanh chóng Quan trọng là quá trình này diễn ra hiệu quả mà không làm ảnh hưởng đến hoạt động của các máy chủ.
Ngoài việc thu thập thông tin, trình thu thập còn có những mục đích phổ biến khác như tự động hóa các tác vụ trên trang web, bao gồm kiểm tra liên kết và xác thực mã.
HTML chủ yếu được sử dụng để thu thập thông tin cụ thể từ web, chẳng hạn như địa chỉ email để gửi spam Một ví dụ điển hình là việc trích xuất giá sản phẩm từ các nền tảng thương mại điện tử Do đó, công nghệ thu thập thông tin web thường được xem xét trong lĩnh vực truy xuất thông tin.
Trình thu thập thông tin web bắt đầu bằng việc phân tích một URL hoặc danh sách các URL Nó truy cập URL đầu tiên, tìm kiếm siêu liên kết đến các trang khác và thêm chúng vào danh sách URL hiện tại Quá trình này lặp lại cho đến khi trình thu thập quyết định dừng lại Hệ thống thu thập thông tin có thể áp dụng nhiều chiến lược khác nhau để thu thập dữ liệu, ảnh hưởng đến cách thức thu thập thông tin từ các trang web tiếp theo.
Bot công cụ tìm kiếm không thể thu thập toàn bộ thông tin trên Internet, nhưng dựa vào các yếu tố như số lượt xem trang, liên kết và uy tín thương hiệu để đánh giá giá trị của trang web Trình thu thập thông tin web xác định các website cần thu thập, cùng với trình tự và tần suất thu thập phù hợp Cuối cùng, sau khi thu thập nội dung, bot sẽ quyết định có hiển thị website của bạn trên trang kết quả tìm kiếm hay không khi có truy vấn.
1.2.3 Các thành phần thu thập thông tin web:
Data Extractor là thành phần quan trọng trong hệ thống thu thập dữ liệu web, thực hiện việc lấy URL từ người dùng và truy cập vào máy chủ liên quan Quá trình này hoàn tất khi gửi yêu cầu HTTP đến máy chủ từ xa, từ đó nhận được thông tin cần thiết.
Ngăn xếp URL được trích xuất lưu trữ các URL mà công cụ trích xuất dữ liệu phát hiện trên các trang web đã xử lý Những URL này được sắp xếp trong hàng đợi để truy cập các trang web tiếp theo.
Bộ lọc miền kiểm tra xem URL nhận được từ ngăn xếp URL có thuộc về một miền nhất định hay không, giúp hạn chế hoạt động thu thập thông tin trong các miền cụ thể.
Trình phân loại URL là thành phần quan trọng trong việc xác định xem một URL có xứng đáng được thu thập thông tin hay không Đối với các URL liên quan đến tệp như jpeg, css, img, js, v.v., trình thu thập thông tin có thể không truy cập vì mục tiêu tìm kiếm các loại thông tin khác nhau.
Valid URL list (Danh sách URL hợp lệ): trong danh sách này, các URL đã được chấp thuận cho các lần truy cập sau này được lưu trữ
Trình phân tích cú pháp HTML là công cụ quan trọng giúp loại bỏ thông tin không cần thiết từ các trang web được viết bằng HTML, tập trung vào nội dung chính Cắt bớt script là một quá trình tương tự, áp dụng cho các ngôn ngữ lập trình như JavaScript Cuối cùng, việc tạo tệp dữ liệu sẽ thu thập thông tin còn lại sau khi đã sàng lọc, nhằm tạo ra các tệp dữ liệu cần thiết từ web.
Lưu trữ dữ liệu là thành phần cuối cùng trong quá trình quản lý thông tin, nơi các tệp được tạo trong cơ sở dữ liệu được lưu trữ Đối với việc thu thập thông tin web tiêu chuẩn để lập chỉ mục, dữ liệu lưu trữ bao gồm chỉ mục của các trang web, thể hiện mối liên kết giữa chúng Google thực hiện việc này bằng cách thu thập dữ liệu và lưu trữ các URL trong cơ sở dữ liệu, sau đó sắp xếp chúng theo mức độ liên quan Khi người dùng tìm kiếm trên Google, quá trình này tương tự như việc duyệt thông tin ngoại tuyến.
Hình 1.2.1 Sơ đồ các thành phần thu thập thông tin và quét web truyền thống
1.2.4 Trình thu thập thông tin web thông minh:
Trình thu thập thông tin thông minh được coi là các thuật toán học máy hoặc kỹ thuật phân tích nâng cao trong lĩnh vực thu thập dữ liệu web và truy xuất thông tin Sự phổ biến của chúng gia tăng nhờ vào khái niệm trình thu thập dữ liệu tập trung, khi mà lượng dữ liệu có sẵn tăng lên nhanh chóng mỗi ngày Do đó, việc thu thập dữ liệu một cách hiệu quả trở thành một yêu cầu thiết yếu.
Các chiến lược thu thập thông tin truyền thống thường tĩnh và không có khả năng học hỏi từ kinh nghiệm hay thích ứng với ngữ cảnh Ngược lại, phương pháp thu thập thông tin thông minh áp dụng mô hình học tập thích ứng, giúp xác định mức độ ưu tiên cho các URL tiếp theo một cách hiệu quả hơn.
1.2.5 Thu thập thông tin thương mại điện tử:
Một phương pháp để xếp hạng các trang web thương mại điện tử là sử dụng mạng nơ-ron truyền ngược có giám sát, với năm biến đầu vào: ưu tiên nội dung, thời gian, đề xuất ngữ nghĩa, phản hồi của người dùng và khuynh hướng đầu vào Sau khi chọn nền tảng thương mại điện tử, trình thu thập thông tin cần tự điều hướng đến trang chi tiết sản phẩm, nơi chứa tên, giá, ảnh, đặc tính, mô tả và đánh giá của khách hàng Các trang chi tiết thường có thiết kế đồng nhất, giúp dễ dàng nhận diện sản phẩm mong muốn Tuy nhiên, nếu mô tả sản phẩm thay đổi đáng kể hoặc không đầy đủ, khả năng thành công của phương pháp này sẽ giảm Để xếp hạng sản phẩm, trình thu thập thông tin cần so sánh và tìm kiếm các sản phẩm phù hợp nhất trên nền tảng thương mại điện tử.
Việc tạo ra một danh sách sản phẩm trong cùng một danh mục của một cửa hàng trực tuyến tưởng chừng đơn giản nhưng thực tế lại là một thách thức lớn Mỗi sản phẩm cần được mô tả bằng nhiều thuộc tính khác nhau, như đặc điểm chung và thông số kỹ thuật Giải pháp tự động cho việc này đòi hỏi phải so sánh hàng chục thuộc tính kỹ thuật và cụ thể, chẳng hạn như tốc độ cửa trập của máy ảnh, đồng thời xử lý hàng trăm sản phẩm trong danh mục.
Tổng quan về quản lý rủi ro
Theo Tổ chức Hải quan Thế giới (WCO), quản lý rủi ro Hải quan là quá trình áp dụng hệ thống các thủ tục và thông lệ nhằm cung cấp cho Hải quan thông tin thiết yếu để giải quyết các vấn đề liên quan đến vận chuyển hàng hóa hoặc lô hàng có rủi ro.
Quản lý rủi ro trong Hải quan là quá trình hệ thống hóa các biện pháp phòng ngừa và giảm thiểu rủi ro Điều này bao gồm việc áp dụng các thông lệ và thủ tục quản lý nhằm cung cấp thông tin cần thiết để xử lý các tình huống rủi ro một cách hiệu quả.
Quản lý rủi ro Hải quan là một công cụ hiệu quả để xử lý dòng chảy của người, hàng hóa, phương tiện và nguồn lực hạn chế, đồng thời giảm thiểu rủi ro mà không cản trở thương mại hợp pháp Việc thực hiện quản lý rủi ro này đòi hỏi sự hợp tác quốc tế, trong đó các hoạt động tình báo và chiến đấu chống gian lận đóng vai trò quan trọng Sự hợp tác xuyên biên giới không chỉ nâng cao khả năng thu thập dữ liệu mà còn cải thiện các phương tiện can thiệp, từ đó góp phần nâng cao hiệu quả trong quản lý rủi ro Hải quan.
1.3.2 Quy trình quản lý rủi ro:
Quản lý rủi ro yêu cầu một kế hoạch và chiến lược thực hiện chi tiết ngay từ đầu Việc áp dụng quy trình quản lý rủi ro có hệ thống và liên tục giúp thực hiện phương pháp luận trong thực tiễn Quy trình này bao gồm các bước cụ thể, hỗ trợ ra quyết định thông qua phân tích bản chất và tác động của rủi ro, đồng thời xác định cơ sở cho các quyết định quản lý, hài hòa với nguồn lực và ưu tiên các biện pháp xử lý Sơ đồ mô tả quy trình quản lý rủi ro sẽ minh họa rõ hơn cho các bước này.
Hình 1.3.1 Sơ đồ quy trình quản lý rủi ro
Sau khi thu thập dữ liệu, cơ quan Hải quan tiến hành quy trình quản lý rủi ro gồm 4 bước Bước đầu tiên là xác định rủi ro, trong đó cần nhận dạng và ghi lại các rủi ro tiềm ẩn thông qua hệ thống quy trình Tiếp theo, cơ quan sẽ theo dõi và chỉ ra những rủi ro có thể phát sinh, cùng với lý do và cách thức mà chúng xuất hiện Cuối cùng, dữ liệu và thông tin hiện có sẽ được sử dụng để định lượng rủi ro, bao gồm phân tích và đánh giá khả năng xảy ra của các hậu quả tiềm ẩn.
Đánh giá rủi ro là quá trình so sánh kết quả phân tích với các tiêu chí đã đặt ra để xác định liệu có cần thực hiện hành động bổ sung hay không Xử lý rủi ro là một quy trình lặp đi lặp lại, bắt đầu từ việc xây dựng và lựa chọn các phương án xử lý, lập kế hoạch và thực hiện các biện pháp đó Sau khi thực hiện, cần đánh giá hiệu quả của phương pháp đã áp dụng và quyết định xem rủi ro còn lại có thể chấp nhận được hay không; nếu không, cần đề xuất phương án xử lý tiếp theo.
1.3.3 Vai trò của quản lý rủi ro:
Quy trình quản lý rủi ro hiệu quả giúp phân bổ nguồn lực tốt hơn, tối đa hóa doanh thu, cải thiện tính tuân thủ pháp luật và giảm thời gian thực hiện thủ tục, từ đó giảm chi phí và nâng cao sự hợp tác giữa doanh nghiệp và Hải quan Đối với cơ quan Hải quan, việc quản lý rủi ro rất quan trọng để đánh giá các rủi ro tiềm ẩn và có phương án giải quyết phù hợp, đảm bảo hoàn thành mục tiêu thương mại nội địa, ngăn chặn buôn lậu và hàng cấm, cũng như cải tiến quy trình quản lý.
Nhân lực là yếu tố then chốt trong việc quản lý thương mại, đặc biệt khi khối lượng thương mại ngày càng tăng trong khi nguồn nhân lực có hạn Do đó, cải thiện phân bố nguồn lực cho các khu vực có mức độ rủi ro cao là rất quan trọng, nhằm nâng cao uy tín quản trị của cơ quan Hải quan đối với doanh nghiệp trong nước và cải thiện năng lực hành chính trong mắt Hải quan nước ngoài.
Quản lý hàng hóa rủi ro và hồ sơ rủi ro là yếu tố quan trọng để quyết định kiểm tra và giám sát Hải quan Điều này hỗ trợ hiệu quả trong việc phòng, chống buôn lậu và ngăn chặn vận chuyển trái phép hàng hóa qua biên giới.
Cơ quan Hải quan sẽ triển khai các biện pháp hiệu quả nhằm phòng chống gian lận thương mại, nhanh chóng xử lý các vụ kiện và khôi phục trật tự thương mại sau khi xảy ra sự cố.
Quản lý rủi ro là một yếu tố quan trọng trong việc xem xét thủ tục Hải quan của hàng hóa qua biên giới Đây là công cụ hiệu quả giúp cơ quan Hải quan phản ứng nhanh chóng, đánh giá và quản trị các rủi ro trong thương mại quốc tế, đặc biệt trong bối cảnh thương mại điện tử đang phát triển mạnh mẽ.
Tổng quan thương mại điện tử
Thương mại điện tử là quá trình mua, bán và trao đổi hàng hóa, dịch vụ, thông tin qua mạng Internet, nơi các cửa hàng truyền thống chuyển mình từ thế giới thực Từ góc độ doanh nghiệp, thương mại điện tử bao gồm toàn bộ hoạt động kinh doanh như marketing, bán hàng, phân phối và thanh toán thông qua các phương tiện điện tử.
Cuộc cách mạng 4.0 đã thúc đẩy sự phát triển mạnh mẽ của thương mại điện tử trên toàn cầu và tại Việt Nam, đặc biệt là trong lĩnh vực thương mại điện tử xuyên biên giới Theo Bộ Công Thương Việt Nam, mặc dù chịu ảnh hưởng tiêu cực từ đại dịch Covid-19, thương mại điện tử Việt Nam vẫn ghi nhận sự tăng trưởng ấn tượng, trở thành một trong những thị trường phát triển nhanh nhất Đông Nam Á Năm 2020, tốc độ tăng trưởng thương mại điện tử đạt 18%, với quy mô thị trường đạt 11,8 tỷ USD, và Việt Nam là quốc gia duy nhất trong khu vực có mức tăng trưởng thương mại điện tử hai con số, dự báo quy mô này sẽ tiếp tục gia tăng trong những năm tới.
Thương mại điện tử xuyên biên giới đang bùng nổ, tạo ra cơ hội lớn cho nền kinh tế toàn cầu và thúc đẩy tăng trưởng mới Sự phát triển này đã cách mạng hóa cách doanh nghiệp và người tiêu dùng thực hiện giao dịch, mang lại nhiều lựa chọn hơn, vận chuyển nhanh chóng và phương thức thanh toán linh hoạt Đồng thời, nó cũng mở ra cơ hội cho các doanh nghiệp nhỏ và vừa tiếp cận thị trường quốc tế dễ dàng hơn nhờ vào việc giảm rào cản gia nhập và chi phí.
Môi trường giao dịch hiện nay phát triển nhanh chóng, đòi hỏi sự hợp tác toàn diện từ tất cả các bên liên quan, bao gồm cả cơ quan Hải quan, để quản lý khối lượng giao dịch ngày càng gia tăng Việc thiếu tiêu chuẩn và hướng dẫn toàn cầu, đặc biệt trong quản lý rủi ro, cần được khắc phục Do đó, Hải quan và các cơ quan biên giới đóng vai trò quan trọng trong việc quản lý luồng vận chuyển thương mại điện tử Cần thiết phải có chiến lược được Tổ chức Hải quan Thế giới (WCO) thông qua nhằm đảm bảo sự chuyển động hợp pháp của thương mại điện tử toàn cầu với sự can thiệp tối thiểu.
Ứng dụng Big Data vào quản lý rủi ro đối với thương mại điện tử xuyên quốc gia
1.5.1 Cách ứng dụng: Để giải quyết thách thức việc kiểm chứng chéo thông tin về giá giữa tờ khai và thông tin trực tuyến trên nền tảng thương mại điện tử, chuỗi 9 bước cần được xây dựng khi thiết kế phần mềm hệ thống như sau:
1 Thu thập thông tin được mô tả trên tờ khai Hải quan, bao gồm mô tả hàng hóa, trị giá hàng hóa, và trọng lượng hàng hóa
2 Biết được số lượng hàng hóa có trong kiện hàng bằng cách so sánh trọng lượng của nó với trọng lượng tiêu chuẩn của sản phẩm
3 Tìm kiếm sản phẩm trên Web
4 Tìm các sàn thương mại điện tử bán sản phẩm đó
5 Tìm sản phẩm đó trên nền sàn thương mại điện tử trên
6 Truy xuất thông tin về giá của sản phẩm từ các trang web thương mại điện tử
7 Tính giá tối thiểu, trung bình và tối đa của các sản phẩm được tìm thấy trên các trang web thương mại điện tử
8 So sánh các mức giá trên với giá trị của kiện hàng khai báo, đồng thời xem xét số lượng sản phẩm được tính có trong kiện hàng và tính toán độ lệch giá theo tỷ lệ phần trăm, liên quan đến giá tối thiểu, trung bình và tối đa
9 Truyền kết quả chênh lệch này và phát đi các chỉ số dự báo rủi ro đèn xanh hoặc đỏ cho các cơ quan Hải quan
Bài viết này trình bày lý thuyết về hệ thống thu thập thông tin web ứng dụng Big Data nhằm nâng cao khả năng quản lý rủi ro trong thương mại điện tử xuyên biên giới Hệ thống sẽ là phần mềm quản lý độc lập, cho phép cơ quan Hải quan nhập thông tin mô tả từ tờ khai Hải quan hàng hóa Sử dụng ngôn ngữ lập trình NLP, hệ thống sẽ xử lý và phân tích mô tả, xác định loại sản phẩm và trọng lượng cũng như số lượng hàng hóa trong kiện Sau khi thu thập thông tin, hệ thống sẽ kiểm tra cơ sở dữ liệu lịch sử để xác định xem mô tả đã được xử lý trước đó hay chưa, từ đó đưa ra các chỉ số dự báo rủi ro chính xác hơn Dữ liệu dự báo rủi ro sẽ được tạo thành từ ba nguồn: giá trị hàng hóa trực tuyến, giá trị khi khai báo và giá trị lịch sử Nếu có sự chênh lệch lớn giữa giá trị lịch sử và giá trị hiện tại trên nền tảng thương mại điện tử, chỉ số dự báo rủi ro sẽ giúp cán bộ Hải quan điều tra nguyên nhân của sự bất thường này.
Cơ quan Hải quan bắt đầu quá trình thu thập thông tin trực tuyến bằng cách nhấn nút “Crawl”, cho phép hệ thống tìm kiếm trên các trình duyệt lớn như Google, Bing, và Baidu Hệ thống này sử dụng ngôn ngữ lập trình HTML Parsing và NPL để lọc ra thông tin liên quan, chỉ truy xuất mô tả của các nền tảng thương mại điện tử từ các đoạn văn bản ngắn trong danh sách kết quả.
Hiện tại, Machine Learning được triển khai thông qua hệ thống Model Run để đề xuất danh sách các trang web cho cơ quan Hải quan thông qua giao diện người dùng Cơ quan Hải quan sẽ phản hồi về các trang web cần thu thập thêm thông tin, và những phản hồi này được lưu vào tập dữ liệu nhật ký (Log DB) để cải thiện Machine Learning bởi Model Calculation Quá trình này sẽ tiếp tục với các sản phẩm phù hợp trong mỗi trang web đã được phê duyệt Hệ thống thu thập thông tin web sẽ xem xét các trang đã chọn và trả về danh sách sản phẩm phù hợp với mô tả trên khai báo Hệ thống cũng yêu cầu cơ quan Hải quan phản hồi về các sản phẩm cần xem xét để tính toán các giá trị tối thiểu, trung bình và tối đa.
Giao diện người dùng (UI) của cơ quan Hải quan không chỉ hiển thị mức giá hàng hóa mà còn cung cấp chỉ số tin cậy (CI) và thông tin về chênh lệch giá, giá trị thấp nhất hoặc trung bình, giúp cơ quan Hải quan đưa ra phản hồi đánh giá hiệu quả hơn Sau khi xác nhận các sản phẩm trong danh sách đề xuất, hệ thống thu thập thông tin web sẽ cung cấp giá tối đa, tối thiểu và trung bình, cùng với các chỉ số dự báo rủi ro như đèn xanh hoặc đèn đỏ Trong quá trình tính toán các chỉ số này, hệ thống cũng xem xét trọng lượng hàng hóa được báo cáo trong tờ khai Hải quan, so sánh với dữ liệu trọng lượng lưu trữ Giá trị hàng hóa được xác định dựa trên giá trực tuyến nhân với số lượng ước tính trong mỗi kiện, tính toán từ trọng lượng gói hàng chia cho trọng lượng sản phẩm trong cơ sở dữ liệu.
1.5.1.1 Các giai đoạn thực hiện: Ứng dụng Big Data vào quy trình quản lý rủi ro Hải quan được thể hiện qua biểu đồ sau:
Hình 1.5.1 Sơ đồ quy trình thực hiện các bước 1-7
Nhóm tác giả đã quyết định sử dụng ngôn ngữ lập trình để mô tả các biến giá trị trong bài viết, bao gồm package_description (mô tả hàng hóa), package_origin (xuất xứ hàng hóa), package_value (trị giá hàng hóa) và package_weight (trọng lượng hàng hóa) Các thông tin này sẽ được nhập vào giao diện người dùng (UI) và sau đó được chuyển đến ứng dụng BUS, nơi biến product_category sẽ được phân tích bằng ngôn ngữ tư duy (NLP) Sau khi phân tích, NLP sẽ cung cấp biến product_category và mô tả hàng hóa mới phù hợp hơn cho việc truy vấn Thông tin này sẽ được chuyển đến Nền tảng Dữ liệu (Data Platform) để kiểm tra lịch sử tệp dữ liệu khai báo Nếu hàng hóa đã được xử lý trước đó, tập dữ liệu sẽ trả về biến historical_value (giá trị lịch sử) để đánh giá rủi ro Phần mềm thu thập thông tin sẽ sử dụng dữ liệu từ NLP và thực hiện truy vấn tìm kiếm với biến mô tả hàng hóa mới, và kết quả tìm kiếm sẽ được lưu trữ trong dịch vụ ứng dụng Tương tác Web.
Cơ sở dữ liệu nhật ký (Log Database) [7] được chuyển qua từ ứng dụng BUS và Nền tảng dữ liệu
Hình 1.5.2 Sơ đồ quy trình thực hiện các bước 8-15
và thông tin sản phẩm để chạy Machine Learning, từ đó đề xuất các sản phẩm phù hợp Cơ quan Hải quan sẽ nhận được biến mới đề xuất các trang web recommendation_websites qua giao diện người dùng UI và sẽ cung cấp phản hồi feedbacks_websites về những trang web mà họ cho là phù hợp nhất Các phản hồi này cũng được lưu trữ trong cơ sở dữ liệu nhật ký Log DB.
[15] để sau này Model Calculation có thể sử dụng chúng để cải thiện mô hình đề xuất
Hình 1.5.3 Sơ đồ quy trình thực hiện các bước 16-26
Ứng dụng chạy các truy vấn mới trên các trang web được xác định bởi cơ quan Hải quan thông qua dịch vụ Web Interact, trả về kết quả sản phẩm trên nền tảng thương mại điện tử và lưu trữ trong cơ sở dữ liệu nhật ký Log DB HTML Parser sẽ phân tích các kết quả này và lưu trữ lại trong Log DB Quá trình tương tự cũng diễn ra với ứng dụng NLP Sau đó, Model Run tạo danh sách đề xuất sản phẩm cho cơ quan Hải quan thông qua giao diện người dùng UI, và phản hồi từ cơ quan Hải quan cũng được lưu trong Log DB.
Trong giai đoạn này, nền tảng dữ liệu Data Platform sẽ truy xuất thông tin về trọng lượng sản phẩm cho loại sản phẩm đã được đề xuất từ quá trình phân tích trước đó.
Thông tin thu thập được sẽ được kết hợp với dữ liệu trước đó để đánh giá rủi ro và cung cấp chỉ số dự báo rủi ro cho cơ quan Hải quan Khi hệ thống ngoại tuyến, dữ liệu Log DB sẽ được tải từ cơ sở dữ liệu để cải thiện các mô hình đề xuất Việc này được thực hiện ngoại tuyến để tránh ảnh hưởng đến hoạt động của cơ quan Hải quan trong quá trình thao tác.
Hệ thống thu thập dữ liệu không chỉ giúp giải quyết chênh lệch giá trong kinh doanh thương mại xuyên biên giới mà còn cung cấp thông tin về trọng lượng và xuất xứ hàng hóa qua Weight Database Điều này tạo nền tảng cho việc thiết kế và tích hợp phần mềm hỗ trợ quản lý rủi ro của Hải quan Tuy nhiên, phần mềm cũng gặp phải một số hạn chế, đặc biệt là ở các sàn thương mại điện tử, nơi một số quốc gia chưa có quy định chặt chẽ, dẫn đến tình trạng không uy tín Ngoài ra, có những sàn độc quyền gây ra chênh lệch giá đáng kể Dù vậy, nhiều quốc gia đang nỗ lực kiểm soát tốt hơn, mở ra triển vọng lớn cho việc sử dụng hệ thống phần mềm này.
Một cách chính thức hơn để mô tả chức năng của kiến trúc phần mềm là sử dụng biểu đồ tuần tự trong ngôn ngữ mô hình hóa thống nhất (UML) Biểu đồ này cũng chia thành hai giai đoạn: giai đoạn xuất hiện của các trang web và giai đoạn xuất hiện của sản phẩm cùng với việc cập nhật mô hình máy.
● Cho đến khi đề xuất các trang web xuất hiện:
Hình 1.5.5 Biểu đồ tuần tự, giai đoạn 1
● Cho đến khi đề xuất của sản phẩm xuất hiện và cập nhật mô hình máy:
Hình 1.5.6 Biểu đồ tuần tự, giai đoạn 2
1.5.2 Ưu điểm khi sử dụng Big Data để quản lý rủi ro Hải quan:
Phân tích dữ liệu trong Big Data giúp Hải quan nhận diện và theo dõi các đối tượng và hàng hóa khả nghi, từ đó dự đoán các mối đe dọa tiềm ẩn Điều này cho phép Hải quan phân bổ và ưu tiên nguồn lực một cách tối ưu, đặc biệt trong bối cảnh có những hạn chế nhất định.
Giao dịch thương mại điện tử thường liên quan đến hàng hóa nhỏ và tần suất gửi nhận cao, tạo áp lực cho cơ quan Hải quan trong việc thông quan nhanh chóng nhưng vẫn phải đảm bảo quản lý nhà nước hiệu quả để phát hiện gian lận Để đối phó với thách thức này, Hải quan cần làm phong phú dữ liệu hiện có, giúp họ có cái nhìn toàn diện hơn về các rủi ro hiện tại.
PHÂN TÍCH THỰC TRẠNG
Trên thế giới
Thương mại điện tử xuyên biên giới mang lại nhiều cơ hội và lợi ích cho người tiêu dùng và doanh nghiệp, cho thấy tiềm năng phát triển mạnh mẽ trong tương lai Năm 2021, hoạt động mua bán trên nền tảng này trở nên sôi động, đặc biệt tại các thị trường hàng đầu như Hàn Quốc, Hoa Kỳ và Hà Lan.
Theo báo cáo Thương mại điện tử toàn cầu, Hàn Quốc đứng đầu về thương mại điện tử nhờ việc triển khai mạng 5G, góp phần cải tiến cơ sở hạ tầng công nghệ Với Internet phủ sóng rộng rãi, 72% trong số 90% người dùng Internet tại đây tham gia vào hoạt động thương mại điện tử.
Từ năm 2020 đến nay, Hàn Quốc đã ghi nhận sự gia tăng đáng kể trong giao dịch thương mại điện tử xuyên quốc gia, đặc biệt là với Nhật Bản, Trung Quốc và Hoa Kỳ.
Kỳ có tỷ lệ lần lượt: 13%, 15% và 48% Sự bùng nổ của KPop đã thúc đẩy thương mại điện tử xuyên biên giới, với tỷ lệ mua sắm cao chủ yếu tập trung vào quần áo, phụ kiện và mỹ phẩm Quần áo và mỹ phẩm dẫn đầu danh sách do ảnh hưởng của xu hướng thần tượng hóa nghệ sĩ trẻ tại Hàn Quốc, nổi bật với các nhóm nhạc như Blackpink và BTS.
Doanh thu từ thương mại điện tử xuyên quốc gia của Hàn Quốc đạt 3.5 tỷ USD vào năm 2020, trong đó 48% đến từ ba thị trường lớn là Hoa Kỳ, Trung Quốc và Nhật Bản Dù có biên giới với Triều Tiên - một quốc gia tách biệt, nhưng với những con số ấn tượng này, thế giới tin rằng thị trường thương mại điện tử xuyên biên giới của Hàn Quốc sẽ tiếp tục phát triển mạnh mẽ và mang lại nhiều thành công hơn nữa trong tương lai.
Hoa Kỳ, với vai trò là siêu cường về xuất nhập khẩu, đang trở thành thị trường hấp dẫn cho thương mại điện tử xuyên biên giới nhờ vào sự đa dạng, chất lượng và tính độc đáo của hàng hóa Amazon.com dẫn đầu với doanh thu 112.5 tỷ USD trong năm 2020, tiếp theo là Walmart.com và Bestbuy.com Theo UNCTAD, Hoa Kỳ sẽ là động lực chính thúc đẩy thương mại điện tử xuyên biên giới Báo cáo của FLOW cho thấy tỷ lệ mua sắm trực tuyến xuyên biên giới tại Hoa Kỳ đã tăng từ 61% vào năm 2019 lên 64% vào năm 2021, mặc dù con số này chưa nổi bật so với các quốc gia khác, nhưng lượng hàng hóa cung ứng nội địa vẫn đáp ứng nhu cầu của người tiêu dùng.
Hoa Kỳ là quốc gia tiên phong trong mô hình bán lẻ trực tuyến, định hình tương lai phát triển của thương mại điện tử Doanh số bán hàng xuyên biên giới từ Canada và Mexico đóng góp đáng kể vào doanh thu từ kênh này Tuy nhiên, theo Statista, Trung Quốc là thị trường mà Hoa Kỳ nhập khẩu nhiều nhất, điều này phần nào bù đắp cho doanh số từ việc bán hàng cho Canada và Mexico.
Việt Nam
Trong những năm gần đây, thương mại điện tử đã trở thành một phương thức kinh doanh phổ biến, đặc biệt trong bối cảnh phát triển kinh tế số tại Việt Nam Dù đại dịch COVID-19 bùng phát vào năm 2020, Việt Nam vẫn ghi nhận sự tăng trưởng mạnh mẽ trong lĩnh vực thương mại điện tử, đứng thứ hai châu Á chỉ sau Hàn Quốc Thương mại điện tử xuyên biên giới cũng có những tín hiệu tích cực, điển hình là thành công của vải thiều Bắc Giang khi xuất khẩu sang thị trường Nhật Bản và EU thông qua sàn VOSO.vn Sự kiện này đã ghi dấu ấn quan trọng trong ngành thương mại điện tử Việt Nam.
Thương mại điện tử xuyên biên giới là một thành tựu quan trọng của chuyển đổi số, mang lại tiềm năng lớn cho cán cân thương mại xuất nhập khẩu của Việt Nam Thứ trưởng Nguyễn Nhật Tân nhấn mạnh rằng chuyển đổi số giúp doanh nghiệp tiết kiệm thời gian, chi phí và công sức, từ đó thúc đẩy hoạt động xuất nhập khẩu Tuy nhiên, thương mại điện tử xuyên biên giới tại Việt Nam vẫn gặp nhiều hạn chế, chủ yếu do thiếu thông tin về quy định của thị trường nước ngoài.
Ngành thương mại điện tử xuyên biên giới tại Việt Nam đang tăng trưởng mạnh mẽ với mức tăng trung bình khoảng 29% trong giai đoạn 2020-2025, theo báo cáo của Google và Temasek Tuy nhiên, sự phát triển này cũng đi kèm với những vấn đề như tình trạng tránh và trốn thuế Năm 2021, thuế thu từ ngành này chỉ đạt 1.317 tỷ đồng, tăng khoảng 15% so với năm 2020, nhưng con số này vẫn rất nhỏ so với khối lượng giao dịch khổng lồ trên các sàn thương mại điện tử xuyên biên giới.
Vấn đề thương mại điện tử hiện nay chủ yếu xuất phát từ hành lang pháp lý và phương pháp quản lý còn hạn chế, gây khó khăn trong việc thu thuế và kiểm soát giao dịch Nhiều doanh nghiệp lợi dụng lỗ hổng pháp lý để trốn thuế, thường bằng cách khai báo sai giá trị hàng hóa, dẫn đến nguy cơ thất thu thuế lớn Ngoài ra, các hành vi gian lận như không kê khai doanh thu, không đăng ký kinh doanh và chỉ giao dịch qua internet cũng làm phức tạp thêm công tác quản lý thuế Để khắc phục tình trạng này, UBND thành phố Hồ Chí Minh khuyến nghị các cơ quan liên quan cần phối hợp chặt chẽ trong việc quản lý thuế và áp dụng phần mềm thông minh để phân tích dữ liệu lớn, với Big Data được xem là giải pháp tiềm năng cho vấn đề này.
Nhằm tận dụng tiềm năng và đối mặt với thách thức trong lĩnh vực thương mại điện tử, Cục Thương mại điện tử và Kinh tế số đã ký kết Biên bản ghi nhớ với Amazon Global Selling Việt Nam với chủ đề “Thương mại điện tử xuyên biên giới: Kỷ nguyên bứt phá” Cục đang tích cực hợp tác với các đối tác lớn trong và ngoài nước, như JD.com, Viettel Post và VPBank, nhằm xây dựng “Gian hàng Quốc gia Việt Nam”.
Đánh giá
Số hóa chuỗi cung ứng toàn cầu và thương mại điện tử xuyên biên giới đang thúc đẩy tăng trưởng kinh tế và thịnh vượng cho các quốc gia Tuy nhiên, sự gia tăng hàng hóa, đặc biệt là kiện hàng nhỏ, đã tạo ra thách thức cho quản lý rủi ro, thu thuế và phân tích dữ liệu của cơ quan Hải quan Ngoài ra, thương mại điện tử xuyên biên giới còn đối mặt với các vấn đề như vi phạm quyền sở hữu trí tuệ và gian lận thương mại, liên quan đến cơ quan chính phủ và đối tác xuất nhập khẩu.
Tổ chức Hải quan thế giới (WCO) đã đề xuất một khung pháp lý nhằm cải tiến quản lý hải quan, nhằm nâng cao hiệu quả và tính minh bạch trong quy trình này Các kiến nghị của WCO tập trung vào việc tối ưu hóa quy trình hải quan, giúp các quốc gia thành viên cải thiện khả năng kiểm soát và giám sát hàng hóa xuất nhập khẩu.
Việc thiết lập một khuôn khổ tiêu chuẩn hóa để trao đổi dữ liệu điện tử giữa các bên liên quan đến thương mại điện tử và hải quan là rất cần thiết WCO đã khuyến nghị các cơ quan hải quan xây dựng chính sách phù hợp, ứng dụng công nghệ của cuộc cách mạng 4.0 như Big Data và Blockchain Đáp ứng nhu cầu này, nhiều cơ quan hải quan trên thế giới đã nhanh chóng phát triển phần mềm quản lý, đặc biệt là trong lĩnh vực quản lý rủi ro, nhằm theo kịp sự phát triển của thương mại điện tử xuyên biên giới.
Nhóm tác giả nghiên cứu các thị trường thương mại điện tử xuyên biên giới để đánh giá tiềm năng và cơ hội mà thương mại điện tử quốc tế mang lại Họ tập trung vào việc tìm hiểu thực trạng ứng dụng tại các nước này, đồng thời phân tích công tác quản lý rủi ro Hải quan để hiểu rõ hơn về những thách thức và cơ hội trong lĩnh vực thương mại điện tử.
Thực tiễn áp dụng Big Data trong quản lý rủi ro đối với thương mại điện tử xuyên biên giới
2.2.1 Cục Hải quan Hàn Quốc (KCS):
Giao dịch thương mại điện tử toàn cầu đang gia tăng nhanh chóng, buộc KCS phải cải tiến hệ thống và quy tắc Hải quan để quản lý rủi ro và thúc đẩy tăng trưởng hàng hóa Vào tháng 2 năm 2021, KCS đã hoàn thành nền tảng Big Data, cho phép phân tích dữ liệu xuất nhập khẩu thông qua các mô hình phân tích Nhờ đó, mặc dù khối lượng hàng hóa thương mại điện tử chuyển phát nhanh đến Hàn Quốc tăng cao, KCS vẫn có khả năng phát hiện các giao dịch bất hợp pháp và gian lận, bao gồm gian lận xuất xứ, nhập khẩu ma túy và trao đổi tiền tệ bất hợp pháp Việc phân tích dữ liệu trên nền tảng Big Data từ tháng 4 đến tháng 8 đã giúp KCS nâng cao hiệu quả trong công tác quản lý và giám sát.
Năm 2021, KCS đã phát hiện 1,7 nghìn tỷ won chuyển khoản có mục đích sai lệch, thực chất được sử dụng cho giao dịch ngoại hối bất hợp pháp và mua tài sản ảo, đồng thời tịch thu 17,6 tỷ won từ doanh nghiệp buôn lậu Hiện tại, KCS đang nghiên cứu cải tiến hệ thống để cho phép các nhà xuất khẩu báo cáo trực tiếp hàng hóa xuất khẩu, nhằm giảm chi phí thông quan và tự động hoàn thuế Hải quan, tạo thuận lợi cho thương mại hàng hóa hợp pháp.
2.2.2 Cục Hải quan và Biên phòng Hoa Kỳ (CBP):
Mỗi ngày, hàng triệu người Mỹ tham gia giao dịch trực tuyến qua các sàn thương mại điện tử, dẫn đến gia tăng hàng nhập khẩu vào Hoa Kỳ Điều này tạo ra thách thức cho Cơ quan Hải quan và Bảo vệ Biên giới Hoa Kỳ (CBP) trong việc quản lý rủi ro, nhằm ngăn chặn hàng hóa bất hợp pháp và kém chất lượng, bảo vệ sức khỏe và an toàn của người tiêu dùng Mối đe dọa từ thương mại điện tử là thực tế, đặc biệt với các lô hàng giá trị thấp, khiến CBP gặp khó khăn trong việc đánh giá rủi ro do thiếu dữ liệu Để khắc phục vấn đề này, CBP đã áp dụng Big Data để xác định và ngăn chặn các hành vi vi phạm Bằng cách sử dụng các công cụ trích xuất dữ liệu và kết nối thông tin từ nhiều nguồn khác nhau, CBP có thể theo dõi và quản lý rủi ro hiệu quả, đồng thời tạo thuận lợi cho thương mại điện tử toàn cầu.
2.2.3 Cơ quan Hải quan Hà Lan (DCA):
Sự tiến bộ công nghệ thông tin và thay đổi hành vi tiêu dùng đã khiến mua sắm trực tuyến trở thành xu hướng toàn cầu, ảnh hưởng đến luồng hàng hóa quốc tế và thúc đẩy sự phát triển của thương mại điện tử xuyên quốc gia Điều này cũng đặt ra áp lực lớn đối với ngành Hải quan Để đối phó, Hải quan Hà Lan đã thành lập bộ phận thương mại điện tử tại sân bay Schiphol, Amsterdam, nhằm theo dõi các gói hàng thương mại điện tử chủ yếu được vận chuyển bằng máy bay Quy trình đánh giá rủi ro thương mại điện tử được thực hiện chặt chẽ để đảm bảo an toàn và hiệu quả.
Hình 2.2.1 Sơ đồ hệ thống Custom Risk Management thương mại điện tử của cơ quan Hải quan Hà Lan
Bộ phận thương mại điện tử của DCA nhận các tệp từ người chuyển phát đã được cấu trúc và sẵn sàng xử lý:
• Hàng được tự do đi khi giá trị mặt hàng có VAT dưới 22 euro và thuế Hải quan dưới 150 euro
Hàng hóa có giá trị trên 22 euro phải được khai báo Hải quan qua hệ thống DMS DCA thực hiện các bước cần thiết như định dạng lại các tệp của người chuyển phát khi không đúng cấu trúc, tiến hành đánh giá rủi ro và đưa ra ba kết quả khác nhau.
• Gửi kết quả đánh giá rủi ro cho bộ phận kiểm tra Từng mặt hàng nào được tự do đi, mặt hàng nào phải kiểm tra
• Gửi danh sách các mục cần kiểm tra tới hệ thống PLATO, hệ thống tương tự được sử dụng để xử lý các tình huống khác
• Gửi một tệp nhật ký để được thêm vào kho lưu trữ lịch sử
Các mặt hàng yêu cầu nộp thuế, với giá trị trên 22 euro, sẽ được chuyển đến hệ thống quản lý tờ khai (DMS), hệ thống này cũng được áp dụng cho hàng hóa nhập khẩu.
Việc tìm kiếm thông tin sản phẩm trên trang web không hề đơn giản như chúng ta nghĩ Chẳng hạn, khi tìm kiếm máy bay không người lái, việc nhập từ khóa như "máy bay không người lái" cùng với các từ khóa bổ sung như "thương mại điện tử" hay "giá cả" có thể không mang lại kết quả chính xác Hơn nữa, việc sử dụng toàn bộ mô tả sản phẩm làm truy vấn tìm kiếm có thể dẫn đến kết quả sai lệch hoặc không có kết quả Do đó, vấn đề quan trọng cần giải quyết khi tìm kiếm sản phẩm trên các nền tảng thương mại điện tử là cách xây dựng truy vấn tìm kiếm phù hợp.
Do đó Hải quan Hà Lan đã thiết lập hai dự án về Web-crawling (thu thập thông tin web) và dự án Machine Learning (học máy)
DCA đã phát triển hai dự án liên quan đến web-crawling: một dự án nhằm thu thập dữ liệu web (chỉ lập chỉ mục) và một dự án tìm kiếm web (truy xuất thông tin) Tuy nhiên, dự án thu thập thông tin web đã bị ngừng lại do công nghệ đã lỗi thời, trong khi công cụ thu thập dữ liệu web hiện tại vẫn đang được áp dụng.
DCA đang áp dụng công nghệ Machine Learning như một hệ thống ra quyết định nhằm xác định các luồng đỏ và vàng cần được kiểm tra Mô hình Machine Learning này hoạt động dựa trên kết quả từ công cụ đánh giá rủi ro và số lượng người kiểm tra có hạn, giúp tối ưu hóa quy trình lựa chọn đối tượng kiểm tra.
Bối cảnh của Việt Nam khi áp dụng Big Data trong việc quản lý rủi ro đối với thương mại điện tử xuyên quốc gia
Nhằm xây dựng Hải quan Việt Nam hiện đại và chuyên nghiệp trong quản lý rủi ro, đặc biệt trong bối cảnh thương mại điện tử xuyên biên giới phát triển mạnh mẽ, việc cải cách và hiện đại hóa Hải quan là rất cần thiết Điều này bao gồm việc áp dụng công nghệ thông tin hiện đại để nâng cao hiệu quả quản lý, giám sát Hải quan, và phòng chống buôn lậu, gian lận thương mại Nhóm tác giả đã đề xuất ứng dụng Big Data trong quản lý rủi ro, đặt ra câu hỏi về tiềm năng của Việt Nam trong việc áp dụng công nghệ này.
Thứ nhất, thương mại điện tử phát triển tạo nên nhu cầu đổi mới công tác quản lý rủi ro Hải quan
Trong những năm gần đây, sàn thương mại điện tử tại Việt Nam đã phát triển mạnh mẽ với nhiều mô hình và chuỗi cung ứng hiện đại nhờ vào sự hỗ trợ của công nghệ thông tin Tuy nhiên, do đặc thù của thương mại điện tử, tính trung thực về hàng hóa chưa được đảm bảo hoàn toàn, dẫn đến việc một số doanh nghiệp lợi dụng để bán sản phẩm kém chất lượng, hàng giả, hàng cấm, và hàng vi phạm quyền sở hữu trí tuệ Tình trạng này không chỉ xảy ra ở Việt Nam mà còn phổ biến trên toàn cầu, ngay cả tại các sàn thương mại điện tử lớn Do đó, việc ứng dụng công nghệ Big Data trong quản lý rủi ro trở thành một giải pháp cần thiết để kiểm soát và bảo đảm an ninh cho các giao dịch hàng hóa, đồng thời ngăn chặn gian lận và dối trá từ các doanh nghiệp.
Thứ hai, doanh nghiệp trục lợi trước xu hướng phát triển sâu sắc của thương mại điện tử xuyên biên giới
Hiện nay, một số doanh nghiệp lợi dụng thương mại điện tử xuyên biên giới để trục lợi bằng cách hợp tác với các sàn giao dịch không uy tín ở nước ngoài, mua hàng giá rẻ và thổi phồng giá bán khi hàng hóa về nội địa Hành động này không chỉ vi phạm giá bán trong các giao dịch độc lập mà còn khiến cơ quan Hải quan gặp khó khăn trong việc xác định chính xác mức thuế mà người mua khai báo, cũng như tiềm ẩn nguy cơ về chất lượng hàng hóa khi nhập khẩu vào nội địa.
Vì lẽ đó, công tác quản lý rủi ro càng phải được chú trọng, cải tiến
Thứ ba, khoa học công nghệ ở Việt Nam ngày càng phát triển, là tiền đề cho việc ứng dụng Big Data
Việt Nam đang nổi lên như một trung tâm công nghệ của Đông Nam Á, nhờ vào sự phát triển mạnh mẽ của công nghệ 4.0 và công nghệ kỹ thuật số Sự kết nối giữa thế giới thực, số và ảo được thể hiện rõ qua các công nghệ như Internet vạn vật (IoT) và trí tuệ nhân tạo (AI) Với sự phát triển của IoT, việc tiếp cận và ứng dụng công nghệ trong nhiều lĩnh vực trở nên dễ dàng hơn Đồng thời, sự tiến bộ trong công nghệ khoa học cũng kéo theo sự thay đổi về cơ sở vật chất, tư duy sáng tạo và năng lực con người Điều này mở ra cơ hội cho Việt Nam trong việc tìm hiểu và ứng dụng công nghệ Big Data vào quản lý rủi ro Hải quan.
Thứ tư, Hải quan Việt Nam hưởng lợi từ việc gia nhập ngày càng nhiều các hiệp định thương mại tự do
Các hiệp định thương mại tự do (FTA) không chỉ tạo điều kiện thuận lợi cho doanh nghiệp xuất nhập khẩu Việt Nam phát huy lợi thế thương mại, mà còn thúc đẩy quá trình chuyển giao công nghệ sâu sắc, ảnh hưởng đến cả khu vực tư nhân và công, đặc biệt là cơ quan Hải quan Một ví dụ điển hình là hệ thống Hải quan điện tử VNACCS và VCIS, được hình thành nhờ ảnh hưởng của Hiệp định Đối tác Kinh tế Việt Nam - Nhật Bản (VJEPA), dựa trên mô hình công nghệ tiên tiến.
Nhật Bản đang triển khai “Hệ thống thông quan tự động” và “Hệ thống Hải quan thông minh”, đồng thời cam kết hỗ trợ Tổng cục Hải quan Việt Nam trong quản lý rủi ro Hải quan Việc gia nhập Liên minh Hải quan VCUFTA với Nga, Belarus và Kazakhstan cũng mang lại lợi ích cho hợp tác Hải quan Việt Nam Những yếu tố này tạo nền tảng vững chắc cho việc phát triển phần mềm ứng dụng Big Data trong quản lý Hải quan, đặc biệt là trong lĩnh vực quản lý rủi ro tại Việt Nam.
Việt Nam đang đối mặt với nhiều thách thức trong quá trình hội nhập quốc tế, mặc dù có nhiều tiềm năng Việc ứng dụng Big Data vào quản lý rủi ro có thể giúp Hải quan Việt Nam nâng cao uy tín trong thương mại quốc tế Do đó, việc nhận diện và tìm cách khắc phục những thách thức khi áp dụng công nghệ Big Data vào quản lý rủi ro là rất cần thiết.
Thứ nhất, nguồn nhân lực Hải quan Việt Nam vẫn còn yếu kém về số lượng và chất lượng
Nguồn nhân lực đóng vai trò quan trọng trong quá trình tăng trưởng và hội nhập kinh tế quốc tế Ngành Hải quan Việt Nam đang gặp khó khăn về cả số lượng lẫn chất lượng nguồn nhân lực, đặc biệt là sự thiếu hụt nhân lực có trình độ chuyên môn cao Việc ứng dụng công nghệ mới đòi hỏi nguồn nhân lực phải phát triển để đáp ứng các yêu cầu mới, từ đó nâng cao hiệu quả hoạt động trong ngành.
Thứ hai, chưa đủ tiềm lực tài chính để đầu tư công nghệ mới
Nền kinh tế Việt Nam đang trong quá trình phục hồi sau đại dịch Covid-19, đối mặt với nhiều thách thức tài chính, đặc biệt là trong lĩnh vực Hải quan Mặc dù có lợi thế từ các hiệp định thương mại tự do, công nghệ của Việt Nam vẫn còn ở giai đoạn phát triển ban đầu, chưa đủ tiệm cận với tiêu chuẩn quốc tế Do đó, việc đầu tư vào công nghệ hiện đại như Big Data trở thành một thách thức lớn cho Việt Nam.
Thứ ba, bộ máy Hải quan hoạt động truyền thống chưa hiệu quả
Bộ máy Hải quan Việt Nam vẫn duy trì cách quản lý truyền thống, dẫn đến sự phức tạp trong quy trình điều hành Việc thiếu đổi mới và hiện đại hóa so với tiêu chuẩn quốc tế tạo ra rào cản lớn trong việc áp dụng công nghệ tiên tiến như Big Data.
Thứ tư, các chính sách làm hạn chế khả năng thu thập thông tin, dữ liệu cho Big Data
Việc thu thập dữ liệu là bước đầu tiên quan trọng trong ứng dụng Big Data, nhưng dữ liệu thương mại từ cơ quan Hải quan vẫn còn hạn chế do luật về sở hữu trí tuệ và bảo mật thông tin tại Việt Nam Ứng dụng Big Data vào quản lý rủi ro sẽ tạo ra những bước đột phá cho Hải quan Việt Nam trong thương mại quốc tế Đánh giá tiềm lực và thách thức khi áp dụng công nghệ mới là cần thiết để đưa ra định hướng và phương án bổ sung, nhằm tối ưu hóa tiềm lực và khắc phục những thách thức hiện tại.