Cointime

Download App
iOS & Android

Dễ dàng tiến hành phân tích dữ liệu blockchain bằng bộ dữ liệu Pinax và Snowflake

Validated Project

TL;DR: Tìm hiểu cách phân tích hiệu quả dữ liệu blockchain bằng cách sử dụng bộ dữ liệu do Pinax cung cấp. Tìm hiểu cách giải pháp của chúng tôi đơn giản hóa việc truy cập vào dữ liệu ETH thông qua các tệp Parquet và cơ sở dữ liệu được quản lý như Snowflake, cho phép bạn thực thi các truy vấn SQL để trích xuất những thông tin chi tiết có giá trị như người dùng hoạt động hàng ngày và hoạt động hợp đồng hàng đầu.

Chúng tôi rất vui mừng được giới thiệu một sản phẩm đang thay đổi phân tích dữ liệu blockchain: Bộ dữ liệu trên The Graph được tích hợp với Snowflake. Trong bài đăng này, chúng tôi sẽ khám phá những vấn đề chúng tôi đang giải quyết, các giải pháp đổi mới của chúng tôi, cách mọi người đang sử dụng bộ dữ liệu của chúng tôi và tầm nhìn của chúng tôi về tương lai.

Liên kết video: https://youtu.be/7CxFGgNmu-Y

Để biết thêm thông tin về tập dữ liệu của chúng tôi, vui lòng đọc bài viết:

Blockchain tạo ra lượng lớn dữ liệu lớn và khó quản lý. Việc trích xuất dữ liệu này, đặc biệt là khi nói đến các tương tác chi tiết từ các nút RPC, yêu cầu phải có công cụ tùy chỉnh.

Các nhà phân tích quen với các công cụ truyền thống như SQL gặp khó khăn trong việc đối phó với sự phức tạp của việc trích xuất dữ liệu blockchain. Kết hợp với thách thức xử lý nhiều mạng blockchain, nó trở thành gánh nặng hoạt động.

Truy cập hiệu quả dữ liệu này cũng có nghĩa là giảm thiểu nhu cầu tải xuống các tập dữ liệu lớn. Đó là lý do tại sao chúng ta cần một giải pháp hỗ trợ lưu trữ dữ liệu để bạn chỉ có thể truy vấn những dữ liệu mình cần.

Các nhà phân tích quen với các công cụ truyền thống như SQL gặp khó khăn trong việc đối phó với sự phức tạp của việc trích xuất dữ liệu blockchain. Cùng với thách thức xử lý nhiều mạng blockchain, nó trở thành gánh nặng hoạt động.

Truy cập hiệu quả dữ liệu này cũng có nghĩa là giảm thiểu nhu cầu tải xuống các tập dữ liệu lớn. Đó là lý do tại sao chúng ta cần một giải pháp hỗ trợ lưu trữ dữ liệu để bạn chỉ có thể truy vấn những dữ liệu mình cần.

Chúng tôi tận dụng hai công nghệ mạnh mẽ: FirehoseSubstreams . Các dịch vụ này chạy trên The Graph và cho phép trích xuất và lưu trữ dữ liệu blockchain một cách hiệu quả. Trước tiên, chúng tôi xác định kiến ​​trúc khối cho các chuỗi khác nhau (dựa trên EVM, Solana, BTC) và sau đó xuất chúng dưới dạng tệp Parquet - về cơ bản là các tệp phẳng có thuộc tính cơ sở dữ liệu. Các tệp này được lưu trữ trên AWS S3 hoặc các nhóm tương thích với S3 khác.

Để làm cho dữ liệu dễ truy cập hơn, chúng tôi không dừng lại ở việc lưu trữ thô. Chúng tôi cũng liệt kê dữ liệu trên Snowflake Marketplace. Bạn có thể truy vấn dữ liệu thô từ S3 hoặc kết nối trực tiếp với cơ sở dữ liệu được quản lý Snowflake để chạy truy vấn SQL đối với tập dữ liệu được quản lý. Tính linh hoạt này cho phép bạn truy cập dữ liệu blockchain theo cách bạn muốn.

Bạn có một số tùy chọn để truy cập dữ liệu của mình. Bạn có thể:

  • Tải dữ liệu thô từ S3 vào cơ sở dữ liệu bằng bảng bên ngoài hoặc phương pháp sao chép trực tiếp.
  • Sử dụng SQL để truy vấn trực tiếp dữ liệu trong cơ sở dữ liệu được quản lý như Snowflake.
  • Lập trình đọc một tệp Parquet bằng thư viện Python như Polars hoặc pandas.

---Ảnh chụp màn hình từ slide video, Đường ống dữ liệu cho Kiến trúc MVP.

Đường dẫn dữ liệu bắt đầu với Firehose, hỗ trợ thiết bị đo đạc các bộ dữ liệu chuỗi khối để tạo ra các loại khối được tiêu chuẩn hóa chảy qua Dòng con. Ở đây, chúng tôi xác định lược đồ cho các loại dữ liệu khác nhau (khối, dấu vết giao dịch, nhật ký) và chuyển đổi chúng thành tệp Parquet.

Dữ liệu được trích xuất có thể được lưu trữ trên S3 và sau đó được sử dụng theo nhiều cách khác nhau, chẳng hạn như công cụ tính toán SQL hoặc thư viện Python. Chúng tôi cũng hỗ trợ hai phương thức cổng khác nhau:

  1. Người yêu cầu thanh toán: Việc thanh toán dựa trên mức sử dụng bộ nhớ S3, cho phép bạn thanh toán cho lượng dữ liệu cụ thể mà bạn truy cập.
  2. Snowflake Marketplace: Bạn có thể truy cập trực tiếp vào tập dữ liệu của mình mà không cần sao chép và tận hưởng sự tiện lợi bổ sung của cơ sở dữ liệu được quản lý sẵn sàng cho SQL.

---Ảnh chụp màn hình từ trình chiếu video, Cổng dành cho Kiến trúc MVP.

Snowflake cung cấp một thị trường nơi bạn có thể dễ dàng tìm thấy các bộ dữ liệu. Ví dụ: tìm kiếm "Ethereum" sẽ hiển thị danh sách từ các nhà cung cấp dữ liệu nổi tiếng. Bộ dữ liệu Ethereum của chúng tôi được dùng thử miễn phí và không có phí niêm yết.

Bạn có thể xem trước dữ liệu để làm quen với cấu trúc của nó bằng cách xem các bảng như khối, nhật ký và băm giao dịch. Hiện tại, Snowflake lưu trữ dữ liệu này ở một khu vực duy nhất (Bắc Virginia, Miền Đông Hoa Kỳ) và chúng tôi dự định bổ sung thêm nhiều khu vực khác trong tương lai nếu cần.

Bạn có thể xem trước dữ liệu để làm quen với cấu trúc của nó bằng cách xem các bảng như khối, nhật ký và băm giao dịch. Hiện tại, Snowflake lưu trữ dữ liệu này ở một khu vực duy nhất (Bắc Virginia, Miền Đông Hoa Kỳ) và chúng tôi dự định bổ sung thêm nhiều khu vực khác trong tương lai nếu cần.

Trong bản demo của chúng tôi, chúng tôi sẽ hướng dẫn cách sử dụng sổ ghi chép Python của Snowflake để phân tích người dùng hoạt động hàng ngày trên Ethereum và trực quan hóa dữ liệu bằng cách sử dụng gấu trúc. Chúng tôi cũng khám phá các hợp đồng hàng đầu theo hoạt động, nêu bật việc đi sâu vào chi tiết cấp hợp đồng dễ dàng như thế nào.

Hiện tại, chúng tôi lưu trữ Ethereum trên Snowflake và S3. Chúng tôi đang tích cực mở rộng để hỗ trợ các chuỗi EVM khác như Base, Arbitrum, BSC và Polygon, cũng như các chuỗi không phải EVM như Solana và BTC. Ngoài ra, chúng tôi mong muốn giảm tốc độ làm mới dữ liệu từ 24 giờ xuống mức thấp nhất có thể, biến việc phân tích gần như thời gian thực trở thành hiện thực.

Chúng tôi rất vui mừng được tiếp tục xây dựng và phát triển sản phẩm, mở rộng hỗ trợ cho nhiều chuỗi khối hơn và nâng cao khả năng thời gian thực để mọi người, từ nhà phân tích đến nhà phát triển, có thể truy cập dữ liệu chuỗi khối.

Dựa trên phản hồi của khách hàng và sự thành công của chương trình thí điểm tập dữ liệu của chúng tôi trên Snowflake, bạn có thể thấy các tập dữ liệu dưới dạng dịch vụ dữ liệu được hỗ trợ đầy đủ trên The Graph trong tương lai.

Nếu bạn muốn khám phá cách chúng tôi có thể đơn giản hóa việc truy cập dữ liệu blockchain dựa trên nhu cầu của bạn, vui lòng truy cập trang web của chúng tôi hoặc liên hệ trực tiếp với chúng tôi để tìm hiểu thêm. Yêu cầu bản demo để xem cách chúng tôi có thể chuyển đổi cách bạn hiểu rõ hơn về dữ liệu blockchain.

(Vui lòng theo dõi blog để biết các thuật ngữ chuyên môn liên quan, nhận xét, thư viện mã, siêu liên kết, v.v.)

Mẹo nhanh, tập dữ liệu ETH của chúng tôi có sẵn để dùng thử miễn phí trên Snowflake!

💡 Bài viết này trả lời các câu hỏi sau:

- Tập dữ liệu blockchain là gì?

- Các nhà phân tích làm việc như thế nào với các tập dữ liệu được lưu trữ trên Snowflake?

- Các cách khác nhau để truy cập dữ liệu tập trung là gì?

- Làm cách nào để dùng thử miễn phí bộ dữ liệu lịch sử giới hạn của ETH?

Các bình luận

Tất cả bình luận

Recommended for you

  • Chủ tịch Ủy ban Ngân hàng Thượng viện Hoa Kỳ: Các điều khoản dự thảo mới liên quan đến lợi suất stablecoin có thể được công bố ngay trong tuần này.

    Theo Cointime, Thượng nghị sĩ Tim Scott, Chủ tịch Ủy ban Ngân hàng Thượng viện, phát biểu tại Hội nghị thượng đỉnh Blockchain DC rằng các nhà lập pháp có thể xem xét dự thảo luật mới, ít nhất là các điều khoản liên quan đến stablecoin, ngay trong tuần này. Ông Scott lưu ý rằng lợi suất stablecoin là vấn đề được thảo luận công khai nhiều nhất trong dự luật, nhưng các nhà lập pháp vẫn đang tiếp tục làm việc về vấn đề này. Ông nói: “Tôi tin rằng tôi sẽ có bản đề xuất đầu tiên để xem xét trong tuần này. Nếu điều đó xảy ra vào cuối tuần, và tôi nghĩ nó sẽ xảy ra, chúng ta ít nhất sẽ biết liệu khung pháp lý có đang hình thành hay không. Nếu vậy, tôi nghĩ chúng ta sẽ ở vị thế tốt hơn.” Ông cũng cho rằng tiến triển này là nhờ nỗ lực của Thượng nghị sĩ đảng Dân chủ Angela Alsobrooks, Thượng nghị sĩ đảng Cộng hòa Thom Tillis và quan chức Nhà Trắng Patrick Witt về vấn đề lợi suất stablecoin. Ông cho biết thêm rằng các vấn đề chưa được giải quyết khác cũng đã được đề cập trong các cuộc đàm phán trong tháng qua, bao gồm mối lo ngại của các nhà lập pháp về các dự án tiền điện tử của Tổng thống Donald Trump và gia đình ông, việc thiếu đại diện lưỡng đảng trong các cơ quan quản lý quan trọng và các quy định về Xác minh danh tính khách hàng (KYC). Ông Scott cũng cho biết: “Tôi nghĩ chúng ta đang rất gần đạt được thỏa thuận về các vấn đề đạo đức và số lượng thành viên cần thiết để thông qua. Chúng ta biết đây là vấn đề quan trọng đối với phía bên kia, vì vậy chúng ta cũng đang giải quyết nó. Tôi nghĩ chúng ta cũng đang đạt được tiến triển trong một số đề cử, đó là tin tốt. Còn về DeFi, đây là lĩnh vực mà Thượng nghị sĩ Mark Warner đang tập trung vào, và Chống rửa tiền (AML) là một phần rất quan trọng trong đó. Vì vậy, tôi nghĩ chúng ta đang tiến lên phía trước về những vấn đề này.”

  • Bản tin buổi sáng vàng | Những diễn biến quan trọng trong đêm ngày 18 tháng 3

    21:00-7:00 Từ khóa: Phantom, Stripe, Autonomous, Iran 1. Iran tuyên bố có thể hợp pháp tấn công các quốc gia cho phép Mỹ và Israel sử dụng lãnh thổ của mình; 2. CFTC Hoa Kỳ: Ví điện tử Phantom không yêu cầu đăng ký làm môi giới; 3. Tổng chưởng lý Arizona đệ đơn kiện hình sự chống lại nhà tiếp thị dự đoán Kalshi; 4. Bộ Ngoại giao Hoa Kỳ đã ra lệnh cho tất cả các đại sứ quán trên toàn thế giới tiến hành đánh giá an ninh "ngay lập tức"; 5. Robinhood Venture Capital đầu tư khoảng 35 triệu đô la vào Stripe và ElevenLabs; 6. GSR đầu tư 57 triệu đô la để mua lại Autonomous và Architech nhằm tạo ra một nền tảng quản lý quỹ tiền điện tử; 7. SEC và CFTC Hoa Kỳ ban hành hướng dẫn mới về tiền điện tử, nêu rõ rằng hầu hết các tài sản kỹ thuật số không phải là chứng khoán.

  • Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) và Ủy ban Giao dịch Hàng hóa Tương lai (CFTC) đã đưa ra các ý kiến ​​mới về tiền điện tử, trong đó nêu rõ rằng hầu hết các tài sản kỹ thuật số không thuộc loại chứng khoán.

    Ngày 18 tháng 3, Cointime đưa tin Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) và Ủy ban Giao dịch Hàng hóa Tương lai (CFTC) đã ban hành một tài liệu hướng dẫn dài 68 trang về tiền điện tử, trong đó nêu rõ hầu hết các tài sản kỹ thuật số không phải là chứng khoán. Tài liệu giải thích mới này nêu chi tiết phân loại stablecoin, hàng hóa kỹ thuật số và token “công cụ kỹ thuật số”, tất cả đều được cơ quan này khẳng định không phải là chứng khoán. Nó cũng cố gắng giải thích cách thức các “tài sản tiền điện tử không phải chứng khoán” có thể trở thành chứng khoán và làm rõ cách luật chứng khoán liên bang áp dụng cho khai thác, đặt cược giao thức và airdrop. SEC cũng giải thích cách thức các tài sản kỹ thuật số không phải chứng khoán có thể trở thành đối tượng của các hợp đồng đầu tư. Cơ quan này nêu rõ trong phần giải thích của mình: “Các tài sản tiền điện tử không phải chứng khoán trở thành đối tượng của các hợp đồng đầu tư khi một nhà phát hành thuyết phục các nhà đầu tư đầu tư vào một doanh nghiệp chung và đưa ra cam kết hoặc tuyên bố sẽ thực hiện công việc quản lý cần thiết, và người mua có lý do để kỳ vọng thu lợi nhuận từ đó.”

  • Mastercard dự định mua lại công ty tiền điện tử ổn định BVNK với giá lên tới 1,8 tỷ đô la.

    Theo Cointime, Mastercard đang lên kế hoạch mua lại công ty khởi nghiệp về cơ sở hạ tầng stablecoin BVNK với giá lên tới 1,8 tỷ đô la, bao gồm khoản thanh toán bổ sung trị giá 300 triệu đô la nếu thương vụ thành công. Thương vụ này diễn ra chỉ bốn tháng sau khi các cuộc đàm phán sáp nhập trị giá khoảng 2 tỷ đô la giữa BVNK và Coinbase đổ vỡ. Cả hai công ty đã xác nhận thỏa thuận trong một tuyên bố chung được phát hành vào thứ Ba.

  • BTC vượt mốc 75.000 đô la

    Dữ liệu thị trường cho thấy BTC đã vượt qua mốc 75.000 đô la và hiện đang giao dịch ở mức 75.033,01 đô la, tăng 2,83% trong 24 giờ. Thị trường đang trải qua biến động mạnh, vì vậy hãy quản lý rủi ro của bạn cho phù hợp.

  • Mạng chính FusnChain sắp ra mắt: blockchain công khai đầu tiên trên thế giới dành cho thực thi tài chính, mở ra cơ sở hạ tầng thực thi tài chính trên chuỗi cho kỷ nguyên PayFi.

    Một sự thay đổi mang tính lịch sử sắp diễn ra trong bối cảnh cơ sở hạ tầng Web3 toàn cầu. FusnChain, mạng lưới chính thức chuyên kết nối thế giới tiền điện tử với dòng tiền thực tế, đã chính thức thông báo về việc sắp ra mắt mạng chính (mainnet) của mình.

  • BTC vượt mốc 71.500 đô la.

    Dữ liệu thị trường cho thấy BTC đã vượt qua mốc 71.500 đô la và hiện đang giao dịch ở mức 71.510,19 đô la, tăng 1,06% trong 24 giờ. Thị trường đang trải qua biến động mạnh, vì vậy hãy quản lý rủi ro của bạn cho phù hợp.