tìm hiểu thêm về Deep web & Dark web.

Bài viết chỉ mang tính chất tham khảo.
1. Khái niệm về Deep web(DW)
Deep web (web chìm) là các trang web ẩn, mạng lưới ẩn trên Internet. Cũng như một tảng băng, phần web chúng ta đang sử dụng hằng ngày được gọi là Surface web và phần này chỉ chiếm một lượng khá nhỏ trong dữ liệu mà Internet đang chứa.
Surface web có thể dễ dàng truy cập bằng bất cứ trình duyệt nào mà không cần bất kỳ một giao thức mã hóa đặc biệt cả. Thường các trang bảo mật thông tin hiện nay của chúng ta sử dụng HTTPS với giao thức bảo mật SSL (hay TLS). Về cơ bản, chỉ mỗi giao thức SSL thôi đã đủ bảo vệ chúng ta khỏi các cuộc tấn công cục bộ đánh cắp dữ liệu rồi. Các dữ liệu trên Surface web được xem là "Indexed-content" (Các dữ liệu được biên - tham khảo thông tin về robots.txt để hiểu thêm chi tiết).
"Web chìm hay còn gọi là mạng chìm (deep web), web ẩn (invisible web, undernet, hay hidden web) là từ dùng để chỉ các trang hoặc nội dung trên thế giới mạng World Wide Web không thuộc về Web nổi (surface Web), gồm những trang không được đánh dấu, chỉ mục (index) và không thể tìm kiếm được khi dùng các công cụ tìm kiếm thông thường. Nội dung của web chìm ẩn bên dưới các bản mẫu HTML.
Web chìm bao gồm nhiều ứng dụng rất phổ biến như web mail và ngân hàng trực tuyến nhưng nó cũng bao gồm các dịch vụ mà người dùng phải trả tiền, và được bảo vệ bởi một paywall, như video theo yêu cầu, một số tạp chí và báo chí trực tuyến, và nhiều hơn nữa. Nhà khoa học máy tính Michael K. Bergman được cho là đã tạo ra thuật ngữ này vào năm 2001 như một thuật ngữ lập chỉ mục tìm kiếm.
Năm 2011, lượng thông tin trên web chìm đã vượt hơn hẳn web nổi." - Wikipedia Tiếng Việt.
Nói tóm lại, DW đơn giản có thể hiểu là các trang web mà không thể tìm kiếm được bằng các Search Engine.
2. Lí do tại sao các Search Engine lại không thể tìm thấy các trang DW?
Có khá nhiều vấn đề trong việc giải thích lí do các Search Engine không thể tìm thấy các trang DW và liệt kê chúng. Về cơ bản, Deep web là hầm chứa các nội dung không được quản lí bởi bất kỳ cơ quan pháp lí nào cũng như là một mạng ẩn danh khiến cho dữ liệu bên trong của nó không thể kiểm soát dẫn đến việc bị lợi dụng bởi các tổ chức tội phạm tạo nên Dark web. Vốn các Search Engine hiện này chúng ta đang dùng như Google, Bing, Yahoo! Search, ... hướng đến đối tượng người dùng đông đảo sẽ không bao giờ đưa các từ khóa nhạy cảm vào trong các hint (gợi ý từ khóa). Cũng như việc không thể tìm thấy các trang web mang tính chất cực đoan, các địa chỉ công khai các nội dung phi pháp... Đó là lí do tiên quyết mà ta không có Search Engine nào để mà surf Deepweb.
Lí do thứ hai Technical hơn một tí, Deepweb vận hành bằng các HTTP servers sử dụng các file "robots.txt" nhằm mục đích tránh việc các Search Engine "nạo"(crawl) dữ liệu từ trang web. Chính vì vậy, các Search Engine không thể tạo ra một mục lục cho nội dung trang web và hiển nhiên chúng sẽ không có trong mục kết quả tìm kiếm rồi.
* Vậy tại sao lại có Deep web Search Engine?
Có rất nhiều các công cụ tìm kiếm Deep web, nhưng có lẽ thứ GẦN chạm tới một công cụ tìm kiếm nhất là Ahmia. Ahmia được xây dựng bởi Juha Nurmi - một nhà phát triển của Tor Project. Lưu ý, Ahmia chỉ là thứ GẦN VỚI MỘT CÔNG CỤ TÌM KIẾM. Về thực chất, Ahmia thu thập các địa chỉ .onion từ mạng Tor và liệt kê chúng thành các mục khác nhau. Mặc định các trang này không có file robots.txt nên sẽ không được liệt kê các chỉ mục bên trong trang web đó. Ngoài ra, Ahmia cho phép chủ của các trang web .onion đăng ký liệt kê tên miền của mình, nhờ đó là có thể nói Ahmia đang là DW "Search Engine" lớn nhất hiện tại. Nhưng dù sao thì vẫn chưa thể có Deep web Search Engine, đơn giản vì Deep web vẫn không có Content Index và Search Engine thì sẽ chẳng thể biết được các trang kia có nội dung như thế nào.
3 Truy cập Deep web
Để khám phá nội dung trên các trang web, các máy tìm kiếm sử dụng các máy dò để lần theo các hyperlink thông qua các số đã biết của cổng giao thức ảo. Kỹ thuật này lý tưởng để khám phá các nguồn tài nguyên trên web nổi, nhưng không có tác dụng mấy đối với web chìm. Ví dụ, những máy dò này không thử tìm các trang liên kết động mà kết quả truy vấn database dựa trên số vô định các truy vấn có thể xảy ra. Chú ý là điều này có thể (một phần) được vượt qua bởi cách cung cấp các đường dẫn tới các kết quả truy vấn, nhưng điều này lại vô tình làm thôi phồng sự nổi tiếng cho một trang deep web.
Vào 2005, Yahoo! thực hiện một dịch vụ tìm kiếm một phần nhỏ của web chìm bằng cách ra mắt Yahoo! Subscriptions. Máy tìm kiếm này tìm kiếm trong vài trang web mà phải đăng ký thành viên mới vào xem nội dung được. Vài trang này hiển thị đầy đủ nội dung cho máy tìm kiếm robot do đó chúng sẽ hiển thị trên kết quả tìm kiếm của người dùng, nhưng sau đó hiển thị lên một trang đăng nhập (log in) hoặc trang đăng ký khi click vào một đường dẫn từ trang kết quả tìm kiếm từ trang đó.
Từ lúc trình duyệt Tor ra đời,người dùng có thể dễ dàng truy cập được vài tầng trong deep web một cách khá an toàn (khỏi những trang dark web hoặc những trang web của tội phạm, web chứa nội dung phi pháp, hacker, thông tin mật...) tràn lan trong deep web mà không được kiểm soát,ảnh hưởng đến sự bảo mật và an toàn của người truy cập. Để duyệt các web trong đấy cần những thư viện các đường dẫn.Và để truy cập được những trang web bảo mật hơn trong web chìm, người dùng cần phải có kiến thức về phần mềm và phần cứng cao. ', ', , và là một vài máy tìm kiếm có khả năng truy cứu vào các trang deep web. Intute đã hết kinh phí vận hành và chỉ lưu trữ tạm thời ngoại tuyến vào tháng 7 năm 2011.
Nói chung, nội dung trên deep web (bao gồm cả dark web) chứa đựng các nội dung sau:
> Bán vũ khí không có giấy phép
> Hình ảnh khiêu dâm trẻ em
> Bán phần mềm độc hại, phần mềm lậu và hướng dẫn về hacking
> Bán thuốc bất hợp pháp
> Bán thông tin thẻ tín dụng bị đánh cắp và tài khoản người dùng
> Bán các tài liệu giả mạo và tiền tệ
> Tuyển dụng sát thủ
> Bài bạc
> Rửa tiền
> Giao dịch nội gián
> ...
* Lí do chúng ta cần Tor để truy cập có thể hiểu nôm na như này:
Mỗi domain chúng ta truy cập sẽ có một DNS server, và domain .onion có một DNS server riêng. Mạng Tor sẽ là cánh cửa để ta có thể thông qua DNS server đó và truy cập vào các Deep web.
4. Khái niệm sai lầm của mọi người về Deep & Dark web
Hiện nay trên Internet, có hàng tỷ bài viết về Deep/Dark web mà hầu hết đều có chung một mô típ là phân tầng. Ví dụ như Tầng 1 bao gồm các công cụ tìm kiếm, chỉ cần Proxy. Tầng 2 bao gồm các web sâu hơn, cần bảo mật cao hơn, abcxyz... Đó là một khái niệm sai lầm.
Chúng ta không nên hiểu chúng là "tầng", mà hãy hiểu nó "level" hoặc là sự phân chia về mức độ. Các mức độ khác nhau cũng không có gì khác nhau ngoài việc truy cập khó khăn hơn do băng thông của mạng ẩn danh. Về cơ bản, đây là các trang web không thể truy cập bằng các công cụ tìm kiếm và trình duyệt thông thường. Đừng nghe một ai dọa bạn rằng Deep web là một thứ gì đó cực kỳ nguy hiểm. Đúng là có nguy hiểm thật nhưng không đến mức đó. Hãy bỏ ra khỏi đầu những câu chuyện Creepy Pasta cũng như những lời đồn về sát thủ nơi Deep web (có đấy). Nhưng chẳng ai rảnh hơi vác dao đến nhà bạn đâu.
Sự khác biệt giữa các trang web trong mạng lưới Deep web chính là content của chúng. Hầu hết các trang trong Deep web được sinh ra bởi các băng nhóm tội phạm, tổ chức tội phạm với mục đích truyền bá chính trị, buôn bán hàng cấm và kiếm việc làm phi pháp. Các trang web mang nội dung phi pháp sẽ được gọi là Dark web chứ đừng nên nghĩ nó có gì đáng sợ lắm. Nhưng tất nhiên, ngay từ khi vào Deep web bạn đã phải cẩn trọng rồi. Trong đó có rất nhiều bộ óc thiên tài nhưng đi sai hướng và sẵn sàng nhét vào máy của bạn một loại Virus gì đó để đánh cắp thông tin, tiền bạc chứ chả mấy ai thèm mang đồ nghề đến để mổ bụng bạn đâu!
Dù sao thì cũng nhớ thật kỹ, thực ra người ta bảo tầng Deep web không giống như tầng địa ngục, chỉ là đi lên tầng càng cao thì mức độ nội dung càng phản cảm, khó chịu hoặc nguy hiểm cũng như NÊN có một mức độ bảo mật cao hơn của trình duyệt cho phù hợp.
** Lưu ý đọc kỹ dòng này trên Wiki để tránh nhầm lẫn:
"Việc chia tầng trên Web chìm có ý kiến trái ngược: Một số cho rằng trên Web chìm có 8 tầng (hoặc hơn). Trong khi số khác khẳng định rằng, trên Web chìm hoàn toàn không có tầng nào cả và khái niệm tầng trên Web chìm dùng để chỉ khả năng bảo mật, khó truy cập của một địa chỉ Internet nào đó, hay mức độ nguy hiểm của các thông tin website chia sẽ... được phân ra nhờ FBI."
5. Deep web/Dark web có gì?
Mọi người luôn tự hỏi rằng Deep web có gì. Xin thưa rằng nó chiếm hơn 80% dữ liệu trên Internet và bạn có thể tìm BẤT CỨ THỨ GÌ trên Deep web, miễn là bạn biết nó ở đâu. Hầu hết các tài liệu mà Deep web chứa đều là những thứ phi pháp nên hãy thật sáng suốt khi đọc & tham khảo những tài liệu ấy.
Dữ liệu của Deep web cũng không chỉ có mỗi những bài đăng thuê giết người, cũng không mỗi các thông tin cực đoan chính trị hay chỉ chứa những clip CP (Child Porn), Deep web cũng chứa rất nhiều kẻ hài hước và rảnh hơi tạo ra những trang Deep web giải trí cao.
Các trang Deep web rất đa dạng về nội dung, giao diện của chúng thường rất sơ khai và thường là ở dạng text web.
Tài liệu của Deep web rất phong phú, một số sẽ cho bạn những kiến thức mà không một sách vở nào và không một thầy cô nào dạy cho bạn. Tương tự, cũng có rất nhiều câu chuyện lịch sử và phi lịch sử mà ngoài đời ta không thể biết. Trên DW đầy rẫy những câu chuyện chính trị bị lấp liếm hoặc vùi lấp bởi dòng chảy lịch sử.
6. Nguy hiểm trên Deep web đến từ đâu?
Như đã nói phía trên, Deep web là "ngôi nhà Internet" của hàng đống loại tội phạm khác nhau, và thứ đáng sợ nhất chính là các Tin tặc.
Khi lướt Deep web, hãy luôn nhớ rằng Deep web là một mạng chìm và là một thứ sản phẩm tin học, chính vì vậy hướng để bạn dễ bị tấn công nhất chính là những thứ bạn đọc và những cái bạn tải về. Các tài liệu của Deep web phong phú và hấp dẫn thật đấy, nhưng phải luôn cẩn trọng vì bên trong những thứ bạn mang về nhà mình thường luôn có quà tặng kèm. Và tất nhiên, bạn biết điều gì sẽ xảy ra rồi đó.
Deep web cũng là nơi trú ẩn của rất nhiều kẻ bệnh hoạn sẵn sàng lừa lọc bạn với đủ trò. Trong đó cũng có rất nhiều tổ chức quốc tế của bọn tội phạm, chính vì vậy mặc dù như trên đã nói bạn đừng lo tới mấy lời hù dọa những kẻ lạ mặt đến nhà và tóm cổ bạn nhưng cũng nên cẩn thận. Chốt lại, Deep web không thể hại bạn nhưng những thứ bạn tải về thì có. Nên đừng dại mà tải mấy file "chào mời" trên DW mà rước họa vào thân nhé.
______________________
Bài viết này là một bài viết chủ quan của bản thân em, lời lẽ cũng không mạch lạc cho lắm căn bản vì em đang vừa đọc thêm một số tài liệu vừa viết bài nên lời lẽ nó hơi lủng củng tí. Nhưng dù sao em cũng hy vọng bài viết này sẽ chỉnh lại những hiểu biết về Deep web trước đây mà đa phần là sai lệch.
______________________
Các link hữu ích:
https://en.wikipedia.org/wiki/Deep_web
https://www.quora.com/Why-is-Tor-required-to-access-the-dar…
https://www.whoishostingthis.com/bl…/2017/…/07/tor-deep-web/
Author: @MonokaiJs | https://nstudio.pw
> Nguồn ảnh trong bài đăng: WhoIsHostingThis

Nhận xét