• Tidak ada hasil yang ditemukan

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ

N/A
N/A
Protected

Academic year: 2024

Membagikan "NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ"

Copied!
10
0
0

Teks penuh

(1)

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ

KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ

NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN* NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI* NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG*

Prediction of pre-consolidation pressure of soft soil using artificial intelligence in some areas of northern delta Vietnam

Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern Delta Vietnam has been predicted by using Artificial Intelligence - Machine Learning through 3 models: Support Vector Regression (SVR), Artificial Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR).

Those models were built by Python programming language and Scikit-learn software machine learning library. The data for this study is 159 soft soil samples which were collected from the construction site and full of physico- mechanical properties were achieved from experiments in laboratory at provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai Duong. We use 15 physical properties of soil as inputs to analyze correlation with Pc. After removing parameters which have a weak correlation with Pc, we have 6 parameters which is strongly correlated with Pc: upper sampling depth (m), lower sampling depth (m), clay content (%), liquidity index, specific gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70%

training set and 30% testing set. Performance of the models were validated by using various statistical measures: Mean Absolute Error (MAE), Root Mean Square Error (RMSE) Correlation coefficient (R) and Coefficient of determination (R2). Results of predicting Pc models show that the performance of the models using different methods is much different where R2-value varies from 0.728 to 0.843. The present study suggested that the ANN-MLP model has the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE

= 0.187 and R=0.923.

Keywords: artificial neural network mutilayer perceptron (ANN MLP), Artificial Intelligencemachine learning, ridge regression (RR), Pre- consolidation pressure, soft soil, support vector regression (SVR).

1. ĐẶT VẤN ĐỀ *

Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn nhất trong quá khứ của lớp đất phủ mà mẫu đất

* Tr ng Đ i học Giao thông vận tải

Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i.

Email: [email protected]/

[email protected]

ở độ sâu nào đó phải chịu [1,2,21]. Đây là một trong những thông số không thể thiếu khi dự báo lún nền đất yếu cũng nhƣ phục vụ tính toán thiết kế giải pháp xử lý nền đất yếu dƣới tác dụng tải trọng đắp, đặc biệt trong xây dựng đƣờng giao thông [1,2,21,24]. Để có chỉ tiêu này, phổ biến hiện nay là tiến hành bằng thí

(2)

nghiệm mẫu đất trong phòng đƣợc lấy từ các l khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng pháp truyền thống này có một hạn chế nhƣ chi phí cao hay kết quả thƣờng có sai số lớn khi mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất lƣợng bảo quản mẫu đất nguyên trạng, tay nghề của những ngƣời thực hiện và độ tin cậy của thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ đến kết quả xác định Pc.

Để thay thế cho các thí nghiệm trong phòng truyền thống này, một vài mô hình thuật toán dựa trên kinh nghiệm đã đƣợc phát triển nhằm dự đoán Pc hay các thông số đất nền khác [2].

Những mô hình này cơ bản dựa trên việc cải tiến phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi quy này thƣờng bị giới hạn bởi số lƣợng hạn chế nhất định phƣơng trình tuyến tính hoặc phi tuyến.

Ngày nay, trí tuệ nhân tạo (Artificial intelligent) hay máy học (Machine learning) đã đƣợc áp dụng rộng rãi trong nhiều l nh vực bao gồm cả địa k thuật nhƣ là nhận diện hay dự báo trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá tiềm năng nƣớc ngầm [9, 10] và dự đoán tính chất vật liệu [11-20]. Trong nghiên cứu này, các mô hình thuật toán SVR, ANN MLP và RR sử dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý cơ bản của đất làm các biến đầu vào (X) để dự báo áp lực tiền cố kết Pc của đất yếu (biến đầu ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của các mô hình dự báo đƣợc kiểm tra, đánh giá hiệu suất bằng các phƣơng pháp thống kê tiêu chuẩn nhƣ giá trị trung bình của tổng các trị tuyệt đối của sai số - Mean Absolute Error (MAE); độ lệch tiêu chuẩn các sai số - Root Mean Square Error (RMSE); hệ số tƣơng quan R - Correlation coefficient (R); và hệ số xác định - Coefficient of detemination (R2). Kết quả nghiên cứu cho phép đề xuất một phƣơng pháp

mới có thể dự đoán Pc với độ tin cậy cao từ các thông số vật lý có đƣợc từ những thí nghiệm của các công trình thực tế, tiến tới xây dựng bộ dự liệu lớn trong tƣơng lai về l nh vực này.

2. DỮ LIỆU VÀ THUẬT TOÁN SỬ DỤNG DỰ BÁO

2.1. Dữ liệu sử dụng

Nghiên cứu này, bộ số liệu với đầy đủ các chỉ tiêu cơ lý xác định trong phòng thí nghiệm sử dụng làm dữ liệu xây dựng mô hình dự báo từ 159 mẫu đất yếu là bùn sét pha hay sét pha trạng thái chảy đƣợc thu thập từ các công trình thực tế tin cậy thực hiện bởi các đơn vị uy tín nhƣ TEDI-HECO, TEDI-GIC, CIENCO1… kết hợp một số mẫu thí nghiệm kiểm chứng bổ sung đƣợc lấy tại một số khu vực trung vùng nghiên cứu. Các thông số này đƣợc coi là các biến đầu vào độc lập cho máy học, tƣơng ứng X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, X13, X14, X15 nhằm xác định biến đầu ra phụ thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của đất đƣợc xem xét sử dụng phân tích trong bài báo này bao gồm: độ sâu lấy mẫu trên và dƣới (X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %), giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt (X8), độ ẩm (X9, %), khối lƣợng thể tích tự nhiên (X10, g/cm3), khối lƣợng thể tích khô (X11, g/cm3), khối lƣợng riêng hạt (X12, g/cm3), độ r ng (X13, %), độ bão hòa (X14, %), hệ số r ng (X15). Thông số dự báo là áp lực tiền cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu nhiên thành hai phần là tập dữ liệu học lấy 70%, dùng để tập luyện cho máy và tập dữ liệu kiểm tra sử dụng 30% còn lại nhằm đánh giá hiệu suất mô hình. Các mô hình này đƣợc xây dựng trên ngôn ngữ lập trình Python và thƣ viện h trợ Scikit-learn.

Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà

STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn

1 X1 35,4 0,5 10,76 7,129003

2 X2 36 1,5 11,31465 7,090925

(3)

STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn

3 X3 69 4,5 26,96541 11,17561

4 X4 84,9 18 53,05535 13,59445

5 X5 77 21,71 51,09472 12,17120

6 X6 39,96 13,08 26,06862 5,296375

7 X7 47,15 6,11 25,02673 8,561346

8 X8 1,94 0,16 0,857799 0,280667

9 X9 70,65 22,12 46,78126 11,48550

10 X10 2,04 1,52 1,735094 0,113142

11 X11 1,67 0,91 1,194969 0,175484

12 X12 2,76 2,65 2,698176 0,022413

13 X13 66,3 37,23 55,71277 6,479979

14 X14 99,97 84,11 96,79566 2,758104

15 X15 1,967 0,593 1,303403 0,315885

16 Y 282,24 20,58 90,12923 0,549973

Phân tích phân phối 159 mẫu cho 15 thông số là các biến đầu vào (X1-X15) và biến đầu ra (Y) cho thấy, các thông số cơ lý của các mẫu đất biến thiên trong khoảng giá trị rất khác nhau (bảng 1 và

hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng riêng hạt (X12, độ lệch tiêu chuẩn 0,022413).

Hình 1: Biểu đồ biến thiên giá trị của độ sâu lấy mẫu trên

Hình 2: Biểu đồ biến thiên giá trị của hàm l ng h t sét

Hình 3: Biểu đồ biến thiên giá trị của độ sệt Hình 4: Biểu đồ biến thiên của giá trị Pc t kết quả thí nghiệm mẫu đất

2.2. Công cụ và thuật toán sử dụng

Ngôn ngữ lập trình Python và th viện mở Scikit-learn:

Python là một ngôn ngữ lập trình thông dịch (interpreted), hƣớng đối tƣợng (object-oriented), và là một ngôn ngữ bậc cao (high-level) ngữ

(4)

ngh a động (dynamic semantics).. Trình thông dịch Python và thƣ viện chuẩn mở rộng có sẵn dƣới dạng mã nguồn hoặc dạng nhị phân miễn phí cho tất cả các nền tảng chính và có thể đƣợc phân phối tự do [18, 23, 25, 27, 29]. Cùng với đó, Scikit-learn là một thƣ viện tài nguyên mở dùng cho máy học, cung cấp nhiều công cụ dùng cho làm khớp mô hình (model fitting), tiền xử lý dữ liệu (data preprocessing), lựa chọn mô hình và nhiều tiện ích khác [23,25].

Thuật toán hỗ tr hồi qui V c tơ (Support Vector Regression - SVR):

H trợ hồi qui Véc tơ (Support Vector Regression - SVR) dựa trên lý thuyết học thống kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào năm 1995 [13, 28, 30]. Nguyên tắc của SVR là xây dựng một mặt siêu phẳng (hyper plane) để

phân loại tập dữ liệu thành các lớp riêng biệt [25]. Bằng cách sử dụng “kernal” phi tuyến SVR ánh xạ không gian đầu vào sang không gian nhiều chiều hơn [26]. Sau đó, siêu phẳng tối ƣu đƣợc xác định trong không gian đặc trƣng (feature space) bằng cách tối đa hóa biên của ranh giới các lớp (margins of class boundaries) [28]. Các điểm đƣợc huấn luyện (trained points) gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là các véc tơ h trợ (support vectors). SVR đƣợc coi là một trong những kỹ thuật lập mô hình chính xác nhất và cũng đƣợc sử dụng rộng rãi trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử dụng SVR nhƣ một kỹ thuật hồi quy bằng cách đề xuất một hàm mất mát (loss function) ε- không nhạy cảm (ε-insensitive) đƣợc thể hiện trong phƣơng trình sau:

Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈ rN, y ∈ r, trong đó x biến đầu vào, y biến đầu ra; rN = N là chiều không gian véc tơ (N - dimensional vector space); r - một chiều không gian véc tơ (r - one dimensional vector space) và ε = vùng l i nhạy cảm (error insensitive zone) (hình 5). Thuật toán SVR cho phép xác định một hàm có thể ƣớc tính các giá trị trong tƣơng lai một cách chính xác [28,30]. Thuật toán hồi quy h trợ véc tơ cho phép hồi quy hàm tuyến tính đƣợc thể hiện trong phƣơng trình sau:

(2)

Hình 5: Sơ đồ nguyên lý thuật toán SVR giải quyết bài toán hồi quy [26]

Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng số có thể hiệu chỉnh (adjustable weight vector); và b = ngƣỡng vô hƣớng (scalar threshold). Để độ dốc (slope) của hàm gần đến 0, giá trị của w phải đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là một bài toán tối ƣu lồi (convex optimization) đƣợc thể hiện trong phƣơng trình sau:

(3)

Với:

Mạng nơ ron nh n tạo đa lớp (Artificial N ural Network Mutilayer Perceptron - ANN MLP):

Mạng nơ ron nhân tạo (ANN) là một tập hợp của các nút đƣợc liên kết với nhau nhằm giải thích và giải quyết các vấn đề có mối quan hệ phức tạp giữa các biến độc lập đầu vào và biến phụ thuộc đầu ra [25]. Mạng perceptron đa lớp (Mutilayer Perceptron - MLP) là một trong những mạng nơ ron nhân tạo, hay một trong những kỹ thuật mạng nơ ron nhân tạo hiệu quả

(5)

nhất trong mô hình và dự đoán đối tƣợng. Do đó nó đƣợc sử dụng nhƣ một mô hình chuẩn của nhiều nhà nghiên cứu [25,27]. ANN MLP có khả năng mô phỏng các quá trình phi tuyến và phức tạp của thế giới thực. Về cơ bản, có thể nói ANN MLP là một mô hình chuyển tiếp bao gồm một lớp đầu vào, một hay nhiều lớp ẩn và một lớp đầu ra nhƣ trên hình 6.

Hình 6: Minh họa một mô hình ANN MLP với 2 lớp ẩn [25]

Số lƣợng của các nút đầu vào phụ thuộc và các thông số đƣợc lựa chọn trong nguồn dữ liệu sử dụng để dự báo, và số lƣợng của số nơ ron ẩn đƣợc xác định dựa trên tập dữ liệu dùng cho máy học trong từng trƣờng hợp cụ thể. Số lƣợng lớp ẩn đƣợc sử dụng cho tính toán và lớp đầu ra đại diện cho mục đích của mô hình. M i nút của lớp ẩn phải kết nối với tất cả các nút của lớp đầu vào, và m i nút của lớp đầu ra phải đƣợc kết nối với toàn bộ nút trong các lớp ẩn. Thông qua các liên kết này, quá trình hoạt động của ANN MLP có thể chia ra hai bƣớc: truyền thẳng và truyền ngƣợc sử dụng thuật toán truyền ngƣợc [25].

Trong nghiên cứu này, để dự báo Pc sử dụng thuật toán ANN MLP có 2 lớp ẩn với số nút lần lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm kích hoạt Sigmoid.

Thuật toán hồi quy s n b n Ridge Regression - RR):

Mô hình Ridge Regression (RR) là phƣơng pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa cộng tuyến các biến độc lập x có mối liên hệ với nhau, và ảnh hƣởng lên kết quả dự báo của y, hay giải quyết các vấn đề về Overfifting (mô hình áp dụng tốt cho dữ liệu học (training) nhƣng không hoạt động tốt trên dữ liệu kiểm tra (test) mà mô hình hồi quy tuyến tính thông thƣờng gặp phải [26,28].

Hình 7: Mối qua hệ đánh đổi giữa bias và variance [27]

RR là mô hình hồi quy phân tích mối quan hệ giữa các biến độc lập và biến phụ thuộc sử dụng phƣơng pháp Regularization, điều chỉnh mô hình sao cho giảm thiểu các vấn đề Overfitting, tối ƣu hay kiểm soát mức độ phức tạp của mô hình để cân đối giữa Thiên vị (Biased) và Phƣơng sai (Variance), qua đó giảm sai số của mô hình. Do vậy, trong nghiên cứu này nhóm tác giả sử dụng mô hình hồi quy sƣờn bên (Ridge Regression) vào việc dự báo áp lực tiền cố kết Pc của đất yếu khu vực nghiên cứu.

3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO ĐỂ DỰ BÁO PC

Tổng cộng 15 thông số đầu vào là các chỉ tiêu vật lý của 159 mẫu đất yếu xác định từ thí nghiệm trong phòng đƣợc lựa chọn (X1-X15).

Tuy nhiên chỉ có một số biến đầu vào có mối quan hệ chặt chẽ với thông số cần dự báo Pc (kết quả đầu ra, hay biến đầu ra Y). Thông qua quá trình xác định mức độ tƣơng quan giữa 15 chỉ tiêu vật lý của đất với áp lực tiền cố kết bằng

(6)

thống kê toán học, cho phép loại bỏ những biến (chỉ tiêu vật lý) ít hoặc không có quan hệ chặt với kết quả đầu ra – biến đầu ra (Pc). Các làm này cho phép rút ngắn thời gian xử lý của mô hình và đồng thời hiệu suất của mô hình dự báo cũng sẽ đƣợc cải thiện.

Sử dụng công cụ “cây hồi qui bổ sung”

(Extra Trees Regressor) của thƣ viện Scikit- learn nhằm tạo ra biểu đồ thể hiện trực quan mức độ quan trọng của các biến độc lập X đối với biến phụ thuộc Y (Pc) trong mô hình dự báo (hình 8).

Hình 8: Mức độ t ơng quan của biến độc lập (Xi đối với biến ph thuộc (Y - Pc) sử d ng

công c Extra Trees Regressor

Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc 6 biến độc lập có mối quan hệ chặt chẽ nhất với Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất thí nghiệm trong phòng nhƣ độ sệt, hàm lƣợng hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ số r ng của đất.

4. THIẾT LẬP MÔ HÌNH VÀ ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH

4.1. Thiết lập mô hình

Trong nghiên cứu này, nhóm nghiên cứu thực hiện 3 bƣớc cho mô hình máy học với các thuật toán trí tuệ nhân tạo lựa chọn để dự báo Pc

của đất yếu khu vực nghiên cứu nhu hình 9, gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ

nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm trong phòng tạo ra 15 thông số đầu vào từ X1 đến X15 là các chỉ tiêu vật lý của đất và biến đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến độc lập có mối quan hệ không chặt với biến phụ thuộc Y (từ 15 biến X ban đầu, sau xử lý rút xuống còn 6 biến X) (hình 8); (3) Tiến hành máy học bằng các thuật toán trí tuệ nhân tạo lựa chọn nghiên cứ để dự đoán Pc, đánh giá hiệu suất các mô hình dựa vào các thông số RMSE, MAE, R và R2.

Hình 9: Sơ đồ xây dựng mô hình máy học để dự báo Pc

4.2. Đánh giá hiệu suất mô hình

Một mô hình đƣợc đánh giá tốt khi sử dụng các biến đầu vào Xi cho ra các giá trị dự báo Ypred sát với giá trị của thực tế đã xác định Ytest [27,28,30]. Để đánh giá hiệu suất của các mô hình máy học, ở đây sử dụng các thông số (1) Root Mean Square Error (RMSE), (2) Mean Absolute Error (MAE), (3) Coefficient of Determine (R2) và (4) Correlation Coefficient (R).

RMSE thể hiện độ lệch tiêu chuẩn các sai số của mô hình dự đoán. Nó đƣợc xác định thông qua công thức [11]:

; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán.

MAE là giá trị trung bình của tổng các trị

(7)

tuyệt đối của sai số mà mô hình dự đoán, đƣợc xác định thông qua công thức [29,30]:

; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán.

Hệ số xác định R2 là một thông số biến đổi từ 0 đến 1 nhằm thể hiện hiệu suất của mô hình dự đoán [28]. Nó đƣợc xác định thông qua công

thức: ; trong đó m

là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán, là giá trị trung bình của các mẫu kiểm tra.

Hệ số tƣơng quan R đánh giá tƣơng quan giữa hai biến số trong quan hệ [30]. R đƣợc thể hiện thông qua công thức sau:

; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng của y, ypred là giá trị do mô hình dự đoán, là giá trị trung bình của các mẫu kiểm tra, là giá trị trung bình của các mẫu dự đoán.

5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ KẾT VÀ PHÂN TÍCH

Sử dụng 3 mô hình thuật toán SVR, ANN MLP và RR nhƣ đã giới thiệu trên, với bộ số liệu sau chuẩn hóa gồm 6 biến độc lập (X1, X2, X3, X8, X12, X15) có tƣơng quan chặt với Pc và tiến hành dự báo theo sơ đồ mô hình máy học đã xây dựng nhƣ trình bày trên hình 9, cho phép dự báo đƣợc Pc. Kết quả dự báo áp lực tiền cố kết Pc của đất yếu khu vực nghiên cứu đƣợc so sánh với giá trị thực tế thí nghiệm (hình 10, 11 và 12).

Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán SVR

Hình 11: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán ANN MLP

(8)

Hình 12: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán RR

Biểu đồ biến thiên kết quả dự báo Pc so với giá trị thực thí nghiệm khá tƣơng đồng về hình thái, về trị số thậm chí trùng khớp nhau (hình 10, 11, 12). Kết quả đánh giá hiệu suất các mô hình sử dụng trong nghiên cứu này thu đƣợc giá trị tốt với tất cả các mô hình thuật toán trí tuệ nhân tạo

dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng mô hình SVR thì MAE=0,171, RMSE=0,231, R=0,873, R2=0,760; với mô hình ANN MLP thì MAE=0,143, RMSE=0,186, R=0,923, R2=0,843;

còn mô hình RR có MAE=0,193, RMSE=0,246, R=0,856, R2=0,728 (bảng 2).

Bảng 2: So sánh hiệu suất các mô hình thuật toán AI sử dụng dự báo Pc.

STT Mô hình RMSE MAE R R2

1 SVR 0,171 0, 31 0,873 0,760

2 ANN MLP 0,143 0,186 0,923 0,843

3 RR 0,193 0,246 0,856 0,728

Bảng 2 cho thấy, kết quả đánh giá hiệu suất dự báo của các mô hình trí tuệ nhân tạo sử dụng trong nghiên cứu này RMSE, MAE, R hay R2 đều có giá trị rất tích cực, chứng tỏ đƣợc độ tin cậy cao khi dự báo Pc thông qua một số chỉ tiêu vật lý dễ xác định khác đã có nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét trong đất; độ sệt của đất; khối lƣợng riêng và hệ số r ng của đất.

Phân tích hệ số xác định R2, kết quả của các mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết quả này cho thấy rằng, độ chính xác của cả 3 mô hình thuật toán AI đã sử dụng trong dự đoán Pc của đất yếu một số khu vực đồng bằng Bắc Bộ ở mức khá tốt, và mô hình RR có độ chính xác thấp nhất trong nghiên cứu này (R2=0,728), trong khi đó mô hình ANN-MLP đạt hiệu suất cao nhất trong dự đoán Pc (R2=0,843).

6. KẾT LUẬN

Áp lực tiền cố kết (Pc) của đất yếu là thông số đất nền không thể thiếu, đƣợc sử dụng để lựa chọn công thức khi phân tích lún cố kết nền đất yếu dƣới tác dụng tải trọng đắp. Nó thƣờng đƣợc xác định bằng đồ giải theo Casagrande từ

thí nghiệm nén cố kết mẫu đất trong phòng với chi phí khá tốn kém và phức tạp. Để thay thế việc thí nghiệm này, một trong 3 mô hình thuật toán trí tuệ nhân tạo SVR, ANN-MLP và RR hoàn toàn có thể sử dụng để dự báo tốt đƣợc Pc

của đất yếu.

Kết quả nghiên cứu chỉ ra rằng, mô hình ANN-MLP có khả năng dự đoán áp lực tiền cố kết Pc của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ là tốt nhất (R2=0,843), trong khi các mô hình còn lại cũng thể hiện khả năng dự đoán khá tốt.

Với việc khai thác các nguồn số liệu khảo sát đất nền từ các công trình thực tế nhiều năm qua, việc ứng dụng kỹ thuật trí tuệ nhân tạo để dự báo áp lực tiền cố kết của đất yếu nói riêng, các thông số đất nền quan trọng nói chung có thể xem nhƣ một công cụ thay thế hiệu quả và đầy triển vọng nhằm giảm thời gian, chi phí và sai số do phải thí nghiệm xác định chúng trên từng mẫu đất. Dựa trên kết quả của nghiên cứu này, có thể đề xuất rằng, cả 3 mô hình thuật toán SVR, ANN-MLP và RR đều có thể sử dụng là công cụ hữu dụng trong dự đoán Pc của đất yếu,

(9)

tƣơng ứng các thông số vật lý quan trọng để dự đoán Pc gồm: độ sâu lấy mẫu, hàm lƣợng hạt sét, độ sệt, khối lƣợng riêng và hệ số r ng.

LỜI CẢM ƠN

Nghiên cứu này đƣợc thực hiện với nguồn kinh phí đƣợc cấp từ Bộ Giáo dục và Đào tạo thông qua đề tài mã số B2020-GHA-03 do trƣờng Đại học Giao thông vận tải chủ trì. Các tác giả xin trân trọng cảm ơn sự h trợ của Vụ Khoa học công nghệ và Môi trƣờng (Bộ Giáo dục và Đào tạo), trƣờng Đại học Giao thông vận tải và các đơn vị đã h trợ số liệu phục vụ cho nghiên cứu.

TÀI LIỆU THAM KHẢO

[1]. A. Casagrande (1936), “The determination of the pre-consolidation load and its practical significance”, Proceedings of the 1st International Conference on Soil Mechanics, Harvard, Vol. 3.

[2]. B. M. Das and K. Sobhan (2013),

“Principles of Geotechnical Engineering”, Cengage Learning, 726p.

[3]. B.T. Pham (2018), “A novel classifier based on composite hyper-cubes on iterated random projections for assessment of landslide susceptibility”, Journal of the Geological Society of India, Volume 91, pp.355-362.

https://doi.org/10.1007/s12594-018-0862-5.

[4]. B.T. Pham, I. Prakash, K. Khosravi, K.

Chapi, P.T. Trinh, and T.Q. Ngo (2018), “A comparison of Support Vector Machines and Bayesian algorithms for landslide susceptibility modelling”, Journal Geocarto International. 34, pp. 1385-1407. https://doi.org/10.1080/

10106049.2018.1489422.

[5]. P.T. Nguyen, T.T. Tuyen, A. Shirzadi, B.T. Pham, H. Shahabi, and E. Omidvar (2019),

“Development of a Novel Hybrid Intelligence Approach for Landslide Spatial Prediction”, Applied Sciences (Basel), vol. 9, p. 2824.

http://dx.doi.org/10.3390/app9142824.

[6]. Q. He, Z. Xu, S. Li, R. Li, S. Zhang, and N. Wang (2019), “Novel Entropy and Rotation Forest-Based Credal Decision Tree Classifier for Landslide Susceptibility Modeling”, Entropy (Basel), vol. 21, p. 106. http://dx.doi.org/

10.3390/e21020106.

[7]. Jie Dou, Ali P. Yunus, Yueren Xu, Zhongfan Zhu, Chi-Wen Chen, Mehebub Sahana, Khabat Khosravi, Yong Yang & Binh Thai Pham (2019), “Torrential rainfall-triggered shallow landslide characteristics and susceptibility assessment using ensemble data-driven models in the Dongjiang Reservoir Watershed, China”, Natural Hazards, volume 97, pp.579–609.

http://dx.doi.org/10.1007 /s11069-019-03659-4.

[8]. K. Khosravi, B.T. Pham, K. Chapi, A.

Shirzadi, H. Shahabi, I. Revhaug, I. Prakash, and D. Tien Bui (2018), “A comparative assessment of decision trees algorithms for flash flood susceptibility modeling at Haraz watershed, northern Iran”, Sci. Total Environ., vol. 627, pp.744-755. [PMID: 29426199]

http://dx.doi.org/10.1016/ j.scitotenv.2018.01.266.

[9]. B.T. Pham, A. Jaafari, I. Prakash, S.K.

Singh, N.K. Quoc, and D.T. Bui (2019), “Hybrid computational intelligence models for groundwater potential mapping”, Catena, vol.182, .104101. http://dx.doi.org/10.1016/j .catena.

2019.104101.

[10]. S. Miraki, S.H. Zanganeh, K. Chapi, V.P.

Singh, A. Shirzadi, and H. Shahabi (2019),

“Mapping groundwater potential using a novel hybrid intelligence approach”, Water Resour.

Manage., vol. 33, pp. 281-302.

http://dx.doi.org/10.1007/s11269-018-2102-6.

[11]. D.C. Camilo, L. Lombardo, P.M. Mai, J.

Dou, and R. Huser (2017), “Handling high predictor dimensionality in slope-unit-based landslide susceptibility models through LASSO- penalized Generalized Linear Model”, Environ.

Model. Softw., vol. 97, pp. 145-156.

http://dx.doi.org/10.1016/j.envsoft.2017.08.003.

[12]. J. Dou, K-T. Chang, S. Chen, A.P.

Yunus, J-K. Liu, and H. Xia (2015), “Automatic case-based reasoning approach for landslide detection: integration of object-oriented image analysis and a genetic algorithm”, Remote Sens., vol. 7, pp. 4318-4342. http://dx.doi.org/

10.3390/rs70404318.

[13]. B.T. Pham, T-A. Hoang, D-M. Nguyen, and D.T. Bui (2018), “Prediction of shear strength of soft soil using machine learning methods”, Catena, vol. 166, pp. 181-191.

http://dx.doi.org/10.1016/j. catena. 2018.04.004.

(10)

[14]. P.G. Asteris, K.G. Kolovos, A.

Athanasopoulou, V. Plevris, and G.

Konstantakatos (2019), “Investigation of the mechanical behaviour of metakaolin-based sandcrete mixtures”, Eur. J. Environ. Civ. Eng., vol. 23, pp. 300-324. http://dx.doi.org/10.1080/

19648189.2016.1277373.

[15]. P.G. Asteris, and K.G. Kolovos (2019),

“Self-compacting concrete strength prediction using surrogate models”, Neural Comput. Appl., vol. 24, No. 2, pp. 137-150. http://dx.doi.org/

10.1007/s00521-017-3007-7.

[16]. P.G. Asteris, A. Moropoulou, A.D.

Skentou, M. Apostolopoulou, A. Mohebkhah, and L. Cavaleri (2019), “Stochastic Vulnerability Assessment of Masonry Structures: Concepts, Modeling and Restoration Aspects”, Appl. Sci.

(Basel), vol. 9, p. 243. http://dx.doi.org/

10.3390/app9020243.

[17]. H. Chen, P.G. Asteris, D. Jahed Armaghani, B. Gordan, and B.T. Pham (2019),

“Assessing dynamic conditions of the retaining wall: Developing two hybrid intelligent models”, Appl. Sci. (Basel), vol. 9, p. 1042.

http://dx.doi.org/ 10.3390/ app9061042.

[18]. P. Sarir, J. Chen, P.G. Asteris, D.J.

Armaghani, and M. Tahir (2019), "Developing GEP tree-based, neuro-swarm, and whale optimization models for evaluation of bearing capacity of concrete-filled steel tube columns", Eng. Comput., pp. 1-19. http://dx.doi.org/

10.1007/s00366-019-00808-y.

[19]. V. Rodriguez-Galiano, M. Sanchez- Castillo, M. Chica-Olmo, and M. Chica-Rivas (2015), “Machine learning predictive models for mineral prospectivity: An evaluation of neural networks, random forest, regression trees and support vector machines”, Ore Geol. Rev., vol. 71, pp. 804-818. http://dx.doi.org/

10.1016/j.oregeorev.2015.01.001.

[20]. A. Trigila, C. Iadanza, C. Esposito, and G. Scarascia-Mugnozza (2015), “Comparison of Logistic Regression and Random Forests techniques for shallow landslide susceptibility assessment in Giampilieri (NE Sicily, Italy)”,

Geomorphology, vol. 249, pp. 119-136.

http://dx.doi.org/10.1016/j.geomorph.2015.06.001.

[21]. B.M. Das (2007), “Principles of geotechnical engineering”, Thomson, 666p.

[22]. B. Sharma, and P.K. Bora (2003),

“Plastic limit, liquid limit and undrained shear strength of soil – reappraisal”, J. Geotech.

Geoenviron. Eng., vol. 129, pp. 774-777.

https://doi.org/10.1061/(ASCE)1090- 0241(2003)129:8(774).

[23]. Manh Duc Nguyen, Binh Thai Pham, Tran Thi Tuyen, Hoang Phan Hai Yen, Indra Prakash, Thanh Tien Vu, Kamran Chapi, Ataollah Shirzadi, Himan Shahabi, Jie Dou, Nguyen Kim Quoc and Dieu Tien Bui (2019), “Development of an Artificial Intelligence Approach for Prediction of Consolidation Coefficient of Soft Soil: A Sensitivity Analysis”, The Open Construction and Building Technology Journal, Volume 13, pp.178-188.

https://doi.org/ 10.2174/ 1874836801913010178.

[24]. J. A. Knappett and R. F. Craig (2012),

“Craig’s Soil Mechanics”, CRC Press, 584p.

[25]. https://www.python.org/doc/essays/blurb/

[26]. Debasish Basak, Srimanta Pal and Dipak Chandra Patranabis (2007), “Support vector regression”, Neural Information Processing – Letters and Reviews, Vol. 11, No. 10, pp.203.

[27]. Binh Thai Pham, Manh Duc Nguyen, Kien-Trinh Thi Bui, Indra Prakashd, Kamran Chapie, Dieu Tien Bui (2019), “A novel artificial intelligence approach based on Multi-layer Perceptron Neural Network and Biogeography- based Optimization for predicting coefficient of

consolidation of soil”,

CATENA, Vol. 166. pp.181-191, https://doi.org/

10.1016/j.catena.2018.04.004.

[28]. https://bigdatauni.com/vi/tin-tuc/tong- quan-ve-regression-phan-tich-hoi-quy.html

[29]. Michael Bowles (2015), “Machine Learning in Python”, John Wiley & Sons, Inc, 360p.

[30]. Sebastian Raschka and Vahid Mirjalili (2017), “Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow”, Packt Publishing, 622p.

Ng i phản biện: TS. NGUYỄN HIẾU CƢỜNG

Referensi

Dokumen terkait

Kết quả nghiên cứu đã cho thấy các chỉ số định lượng cảnh quan là nguồn thông tin quan trọng phản ánh thay đổi của hình thái rừng qua thời gian mà không thể mô tả được nếu chỉ sử dụng

Nghiên cứu này trình bày một số kết quả hiệu chỉnh, kiểm nghiệm mô hình SWAN và thử nghiệm hệ thống dự báo tổ hợp sóng biển tại Trung tâm Dự báo KTTV quốc gia dựa trên mô hình sóng SWAN

Tại khu vực miền Trung nói chung, TP Đà Nẵng nói riêng, mô hình WRF được nghiên cứu ứng dụng phục vụ cảnh báo, dự báo thời tiết, thiên tai bão, ATNĐ, mưa lớn với độ phân giải miền tính

Hình 3: Trạm đo mực nước, sóng, dòng chảy Hình 4: Địa hình khu vực nghiên cứu 3.3 Điều kiện biên và điều kiện ban đầu Để tính toán chế độ thủy động lực và vận chuyển bùn cát khu vực

Cho đến nay, nhiều nghiên cứu trên thế giới đã được thực hiện nhằm xác định khả năng hội nhập tiền tệ của các nước thuộc khu vực châu Á nói chung và các nhóm nước trong châu lục này nói

- Các chỉ số đa dạng loài dùng để tính độ đa dạng loài của một khu vực nghiên cứu gồm: + Chỉ số đa dạng Shannon - Weiner chỉ số H’ được tính theo công thức sau: Nghiên cứu đánh giá độ

Một nghiên cứu khác cũng chỉ ra được các yếu tố chính ảnh hưởng đến quyết định tăng giá dự thầu của nhà thầu ở Kuwait, bao gồm “quyết định quy mô và loại hình nhà tuyển dụng; quy mô dự

Kết luận Sử dụng phương pháp BIAS để hiệu chỉnh lượng mưa dự báo từ mô hình RAMS cho thấy, kết quả dự báo lượng mưa trong năm 2016 được cải thiện đáng kể, các chỉ số ME sau hiệu chỉnh