Sử dụng các công cụ tìm kiếm web sâu cho nghiên cứu học thuật và học thuật

nghiên cứu học thuật hàn lâm


Bạn có thể đã nghe thấy thuật ngữ này trong thời gian qua, chủ đề được đồn đại nhưng hiếm khi được nói đến của các trang web sâu sâu. Một trang web bên dưới web, chứa đầy petabyte dữ liệu và thông tin nằm ngoài tầm với của thanh tìm kiếm Google, Bing hoặc Yahoo tiêu chuẩn của bạn.

Nhưng chính xác thì web sâu là gì và nó phục vụ mục đích gì cho cộng đồng nghiên cứu lớn hơn? Đọc trong hướng dẫn của chúng tôi để tìm hiểu mọi thứ bạn cần biết về web sâu, bao gồm ý nghĩa của nó, nơi nó sống và cách bạn có thể sử dụng nó để làm lợi thế của mình.

Deep Web: Một định nghĩa đúng

Google sử dụng những gì được biết đến như là một trình thu thập dữ liệu dựa trên nhện nhện để truy tìm trang web cho các kết quả trang web tĩnh và sau đó trả lại chúng cho bạn khi bạn đưa đúng thuật ngữ vào thanh tìm kiếm. Điều này chỉ bao gồm một phần rất nhỏ thông tin thực tế mà có sẵn trên web.

Bất kỳ kết quả nào bạn nhận được từ một tìm kiếm cơ bản của Google đều từ những gì được biết đến với tên gọi là Surface Surface Web. Surface Web bao gồm những điều cơ bản của bạn: phương tiện truyền thông xã hội, trang web tin tức, mua sắm, blog, v.v..

Sau đó, có mạng lưới Deep Web Deep, không bị nhầm lẫn với Web Dark Web, một phần của internet thường được kết hợp với các dịch vụ kết nối bảo vệ quyền riêng tư như TOR và các thị trường ma túy trực tuyến như Silk Road hiện không còn tồn tại.

Xem thêm: Cách truy cập web sâu và darknet

Web sâu chứa một torrent cập nhật liên tục các thông tin thô, chưa được kiểm tra, tăng vọt với các thuật ngữ kỹ thuật phức tạp và rất nhiều sơ đồ đủ để làm cho Google ED Deep Dream AI thổi bùng lên một bảng mạch. Đây là những tài liệu lưu giữ hồ sơ cho những thứ như dữ liệu điều tra dân số, dữ liệu sứ mệnh của NASA, bằng sáng chế và cơ sở dữ liệu giấy học thuật.

Nó đã ước tính rằng toàn bộ web bề mặt chỉ chiếm khoảng 20 terabyte thông tin, hoặc 5 phần trăm thông tin có sẵn cho tìm kiếm mở. Mặt khác, web sâu chiếm khoảng 7,5 petabyte thông tin, hoặc chỉ khoảng 95 phần trăm của tổng số.

Cách tìm kiếm trang web sâu

Biết nhìn vào đâu khi lặn xuống vực sâu cuối web là bước đầu tiên và có lẽ là quan trọng nhất bạn nên thực hiện trước khi bắt đầu bất cứ điều gì khác. Mặc dù web sâu gần như vô cùng rộng lớn khi nói đến lượng thông tin bạn có thể tìm thấy, không giống như hầu hết mọi người thường sử dụng khi tìm kiếm thứ gì đó trong Google, tất cả dữ liệu đó đều không tập trung ở cùng một nơi.

Điều này có nghĩa là đối với nhiều đối tượng khác nhau mà bạn có thể nghĩ đến (tài chính, phần mềm, kinh doanh, kinh tế, học thuật, v.v.), có một số lượng công cụ tìm kiếm tương đương được thiết kế để đi sâu vào kho lưu trữ web sâu của các đối tượng cụ thể đó.

Một vấn đề mà một số nhà nghiên cứu gặp phải là vấn đề về paywalls. Ở đó, không có xung quanh nó; để chạy các trang web / cơ sở dữ liệu này và bật đèn lên, nhiều trang web được đề cập dưới đây sẽ giữ nội dung của chúng ẩn sau một tường trả có thể có giá lên tới $ 50 để đọc một tài liệu hoặc gói thuê bao hàng tháng giúp bạn truy cập vào tất cả nội dung cho một khoản phí cố định.

Nếu paywalls là một vấn đề đối với bạn, một công cụ chúng tôi khuyên bạn nên kiểm tra là tiện ích mở rộng trình duyệt Google Chrome Unpaywall. Unpaywall tự động truy cập web để tìm phiên bản miễn phí của bất kỳ nội dung nào mà bạn đang cố gắng truy cập có nội dung đó đằng sau một tường thành. Không phải lúc nào bạn cũng có thể nhận lại kết quả miễn phí cho mỗi bài viết mà bạn tìm kiếm, tuy nhiên, nó vẫn rất hay để biết tùy chọn có ở đó nếu bạn cần nó trong một nhúm.

Bên dưới chúng tôi đã bao gồm một danh sách một số dịch vụ mà chúng tôi nghĩ là làm tốt nhất việc lập danh mục tất cả thông tin bạn có thể cần trong dự án nghiên cứu tiếp theo của bạn, ghi chú đặc biệt để làm nổi bật những dịch vụ giúp tìm kiếm dễ dàng hơn hầu hết.

web sâu so sánh tìm kiếm học thuật

JSTOR – Bổ sung đầu tiên – và có lẽ rõ ràng nhất – vào danh sách này là cơ sở dữ liệu JSTOR. Được thành lập vào năm 1995, kho tàng nghiên cứu này tiếp tục là một trong những điểm dừng đầu tiên cho bất kỳ nhà nghiên cứu học thuật nào trên đường xuống hố thỏ. Cung cấp các tìm kiếm toàn văn bản cho hơn 2.000 tạp chí cá nhân và hơn 15.000 cuốn sách, JSTOR là một công cụ bắt buộc cho bất kỳ ai thích cách tiếp cận một cửa hàng khác trên một cửa hàng khác trong khi lặn sâu dữ liệu. JSTOR cho phép bạn truy cập tối đa ba cuốn sách miễn phí, trong khi đăng ký dịch vụ JPASS ($ 19,50 một tháng / $ 199 mỗi năm) sẽ cho bạn đọc không giới hạn và 10 lần tải xuống PDF mỗi 30 ngày (tối đa 120 mỗi năm). Nếu bạn có thể đủ khả năng, thì nhiều trường đại học (cụ thể hơn là giáo sư của họ) nên có một thuê bao mà họ đã sẵn sàng cho phép bạn sử dụng miễn là bạn yêu cầu đủ!

Archive.org – Một cơ sở dữ liệu khổng lồ về phương tiện truyền thông đã được nhập vào phạm vi công cộng. Bản ghi âm, video cũ, sách hiếm, hầu hết mọi thứ bạn có thể cần để xây dựng bài thuyết trình tuyệt vời tiếp theo của bạn ở trường, nơi làm việc hoặc cả hai! Hợp tác với Wayback Machine, nơi có hơn 280 tỷ trang web đã được lập chỉ mục kể từ khi gần như sự ra đời của chính Internet.

Thư viện Quốc hội – Kho lưu trữ số hóa tất cả mọi thứ mà Lôi vào Thư viện Quốc hội. Hơn 200 năm thông tin lịch sử cũng như khối lượng cập nhật

Osti.gov – Lưu trữ nghiên cứu của chính phủ, hoàn chỉnh với lịch sử của tất cả các nghiên cứu được thực hiện bởi chính phủ. Tiền thuế của bạn đã trả cho những thứ này, vậy tại sao họ không thuộc về họ? 100% có thể tìm kiếm và có khả năng trả về kết quả từ bất kỳ tài liệu nào mà bạn đang cố gắng tìm kiếm.

Chung

Danh mục GPO của Tạp chí Chính phủ Hoa Kỳ – Cơ sở dữ liệu ấn phẩm liên bang.

Lưu trữ quốc gia – Lưu trữ quốc gia Công cụ nghiên cứu và cơ sở dữ liệu trực tuyến. Nếu có bất cứ điều gì bạn cần biết về lịch sử America America hoặc tình trạng hiện tại của quốc gia, thì đây là nơi.

HighWire Press – Danh mục trực tuyến của kho lưu trữ lớn nhất miễn phí toàn văn bản và văn bản không miễn phí, nội dung được đánh giá ngang hàng, từ hơn 1.000 tạp chí khác nhau. Nó bị tấn công hoặc bỏ lỡ những gì mà đằng sau một bức tường và những gì không phải là. Cách duy nhất để tìm hiểu là lọc các cụm từ tìm kiếm của bạn đến một điểm mà bạn có thể thấy đủ các ấn phẩm ở cả bên được trả tiền và không phải trả tiền của lối đi để quyết định xem bạn có cần rút ví đó hay không.

Encyclopedia Britannica – Google gốc, hiện đang trực tuyến với tất cả các hình ảnh và văn bản tuyệt vời mà bạn vẫn nhớ từ những cuốn sách!

FRED – Dữ liệu tài chính cập nhật bao gồm chuỗi thời gian 470.000 từ 85 tài nguyên khác nhau, cơ sở dữ liệu này được cung cấp miễn phí nhờ sự giúp đỡ của Ngân hàng Dự trữ Liên bang St. Louis. FRED liên kết với một số tài nguyên ấn tượng không kém khác cho dữ liệu kinh tế. Nó phải là nguồn tài nguyên chính cho bất cứ ai làm nghiên cứu trong lĩnh vực lý thuyết tài chính và kinh tế ở Mỹ.

Sách

Google Sách – Sự lựa chọn rõ ràng nhất. Mặc dù các danh sách khác bên dưới là tốt cho những gì họ làm, nhưng không ai có thể đo lường được khả năng quét sách của Google. Một số cuốn sách sẽ có bản xem trước một phần, những cuốn khác có sẵn đầy đủ, và thậm chí nhiều hơn nữa vẫn giành chiến thắng cho phép bạn xem bất cứ điều gì cả. Tất cả văn bản được số hóa (và có thể tìm kiếm), nhưng việc bạn có thể đọc kết quả của mình hay không phụ thuộc hoàn toàn vào trạng thái của giấy phép bản quyền đối với đoạn văn bản cụ thể đó.

Scribd – Điều này có thể không hoàn toàn chính xác về vai trò của cơ sở dữ liệu nghiên cứu học thuật cuối cùng của bạn, tuy nhiên dịch vụ đăng ký hàng tháng vẫn là một cách tốt để cập nhật bất kỳ bài viết mới nào có thể đang chạy trên tạp chí yêu thích của bạn hoặc có thể tìm kiếm qua sách mà chỉ cần lên kệ. Phần tài liệu cho phép người dùng tải lên khá nhiều thứ với một vài hạn chế, do đó, nó trở thành kho lưu trữ cho nhiều sách giáo khoa và nội dung học thuật khác. 

Project Gutenberg – 53.000 sách điện tử miễn phí có sẵn trực tuyến, cũng là một phần của cơ sở dữ liệu tìm kiếm của Archive.org.

Trang sách trực tuyến – Cơ sở dữ liệu có thể tìm kiếm gồm hơn 28.000 cuốn sách tiếng Anh với toàn bộ văn bản có sẵn trực tuyến.

Viện nghiên cứu Getty – Bộ sưu tập thư viện của Viện nghiên cứu Getty bao gồm hơn một triệu cuốn sách, hình ảnh nghiên cứu, tạp chí định kỳ và danh mục đấu giá. Ngoài ra còn có một bộ sưu tập khá sâu các vật liệu quý hiếm hoặc độc đáo tập trung vào lịch sử nghệ thuật và kiến ​​trúc.

Pháp luật và chính trị

Thư viện pháp luật của Quốc hội – Tuyên bố là bộ sưu tập tài liệu pháp lý lớn nhất thế giới, hơn 2 triệu tập.

THOMAS (Thư viện Quốc hội) – Thông tin lập pháp từ Thư viện Quốc hội. Tất cả các hóa đơn hiện tại và quá khứ đã từng được trình bày trên sàn của Hạ viện được lưu trữ tại đây.

LexisNexis – Tài nguyên vững chắc cho bất kỳ sinh viên luật mong muốn hoặc luật sư hành nghề. Cơ sở dữ liệu thông tin được cập nhật hàng ngày, mặc dù nó không rẻ. Giá cho các dịch vụ khác nhau do LexisNexis cung cấp sẽ khác nhau tùy thuộc vào dịch vụ và thậm chí cả tiểu bang bạn đang tìm kiếm, nhưng dự kiến ​​chi tới $ 125 / tháng cho các dịch vụ như Lexis Advance, cho phép bạn tìm kiếm qua hàng triệu tài liệu pháp lý và tòa án trong trường hợp thực tế từ khắp nơi trên nước Mỹ. Thư viện địa phương hoặc trường đại học của bạn có thể có một thuê bao bạn có thể sử dụng.

Y tế và sức khỏe

Science.gov – Cổng thông tin khoa học được cung cấp bởi các cơ quan chính phủ Hoa Kỳ. Tìm kiếm một cơ sở dữ liệu tổng hợp gồm 200 triệu ấn phẩm và tạp chí khác nhau, tốt nhất cho bất kỳ ai đang cố gắng nghiên cứu về các chủ đề được đề cập cụ thể trong danh mục Khoa học Hồi giáo.

PubMed – Thư viện Y khoa Quốc gia Hoa Kỳ chứa hơn 16 triệu trích dẫn từ MEDLINE và các tạp chí khoa học đời sống khác đã tìm đến 1950 1950. Một trong những cơ sở dữ liệu y tế đầu tiên và vẫn là một trong những cơ sở dữ liệu y tế tốt nhất hiện nay.

Globalhealthfacts.org – Cơ sở dữ liệu được lập chỉ mục về thông tin y tế thế giới, có thể tìm kiếm theo loại bệnh, quốc gia, điều kiện, triệu chứng, v.v. Tài nguyên tuyệt vời với hàng trăm infographics có thể được sử dụng để giải thích các số liệu thống kê về các vấn đề sức khỏe nhất định trên phạm vi rộng hơn.

Tạp chí Y học New England – Một trong những tạp chí y học hàng đầu với đầy đủ các vấn đề trong quá khứ có sẵn trực tuyến. Hãy sẵn sàng trả tiền cho một số nội dung, nhưng cũng có một chút miễn phí.

Khoa học và học thuật

Địa lý và Địa chất


Khảo sát Địa chất Hoa Kỳ – Được đóng gói với nhiều bản đồ và hình ảnh nhất có thể, bao gồm nhiều khía cạnh khác nhau của địa hình Hoa Kỳ.

Bản đồ quốc gia Hoa Kỳ của USGS – Nguồn dữ liệu không gian địa lý hiện tại từ USGS. Tất cả các bản đồ được cung cấp đều có sẵn tương tác trên web, cũng như ở các định dạng có thể tải xuống của chúng.

Dữ liệu nước theo thời gian thực của USGS – Bản đồ của Hoa Kỳ hiển thị dữ liệu chất lượng nước theo thời gian thực của quốc gia Sông và hồ chứa.

Chương trình Nguy cơ Động đất USGS – Bản đồ thế giới hiển thị dữ liệu động đất theo thời gian thực. Sử dụng một bản đồ tương tác mà bạn có thể sử dụng để nhảy từ vị trí này sang vị trí khác, thú vị cho bất kỳ ai, người thậm chí còn có một mức độ quan tâm đến những gì mà thực sự xảy ra ngay dưới chân chúng ta.

Vật lý và Thiên văn học

Hệ thống dữ liệu vật lý thiên văn SAO / NASA – Một công cụ dữ liệu vật lý và thiên văn cho các bài báo học thuật. Mỗi bài báo bạn muốn đọc phải được yêu cầu riêng, có thể gây rắc rối, nhưng vẫn là một trong những cách tốt nhất để có được dữ liệu thô từ các kính viễn vọng và thí nghiệm vật lý từ khắp nơi trên thế giới.

Chỉ số học thuật – Chia thành hai loại tìm kiếm khác nhau: tìm kiếm chính về cơ bản trả về kết quả Google được điều chỉnh tốt hơn và loại tìm kiếm khác tìm kiếm các trang web học thuật sâu.

Kỹ thuật và Công nghệ

Thư viện kỹ thuật số IEEE Xplore – Chứa hơn 1,4 triệu tài liệu từ Viện Kỹ sư Điện và Điện tử. Cơ sở dữ liệu có thể tìm kiếm các tài liệu cập nhật liên quan đến hầu hết mọi thứ và mọi thứ liên quan đến kỹ thuật điện và công nghệ nói chung.

TechXtra – Truy cập miễn phí các báo cáo, tài liệu điện tử, nghiên cứu, tin tức trong ngành và thậm chí cả danh sách công việc trong các lĩnh vực toán học, khoa học và kỹ thuật.

Linh tinh

Core – Cơ sở dữ liệu tìm kiếm lớn nhất thế giới của các tài liệu nghiên cứu truy cập mở. Cơ sở dữ liệu khổng lồ của các bài báo và nghiên cứu tổng hợp, tất cả các văn bản có thể tìm kiếm. Nên là điểm dừng đầu tiên của bạn cho bất kỳ nghiên cứu ban đầu nào có thể không yêu cầu lặn sâu như ở một nơi khác.

Arxiv – Kho lưu trữ của Đại học Cornell. Truy cập hơn 700.000 tài liệu kỹ thuật về mọi thứ, từ sinh học định lượng đến khoa học máy tính. Xuất hiện để cung cấp văn bản đầy đủ trong một số định dạng.

DeepDyve – DeepDyve là một tàu đánh cá thương mại đã tổng hợp khá đúng hàng triệu bài báo trên hàng ngàn tạp chí khoa học. Nếu bạn đang tìm kiếm bất cứ điều gì theo cách của các dự án STEM, thì đây là một nơi tuyệt vời để bắt đầu (tuy nhiên, bạn sẽ phải trả tiền cho đặc quyền), tuy nhiên).

Tài nguyên video 

VideoLectures.net – Tập hợp các bài giảng video thực sự mạnh mẽ từ các nguồn có thẩm quyền cao, gần 20.000 bài giảng để lựa chọn và hơn 22.000 video thông tin trong tổng số.


Web là một nơi khổng lồ, tuyệt vời chứa đầy bất kỳ thông tin nào bạn có thể mơ ước và sau đó là một số thông tin. Bằng cách sử dụng các trang web và công cụ tìm kiếm này để truy tìm trang web sâu, bạn có thể chắc chắn rằng bài báo học thuật tiếp theo, luận án tiến sĩ hoặc bài luận nhập học đại học của bạn sẽ được đóng gói với các nguồn phong phú nhất có thể.

Thư viện của hoàng cung từ từ được cấp phép theo CC BY 2.0

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map