SIGNET_FORGE/signet__wasm_8cpp_source.html

// SPDX-License-Identifier: AGPL-3.0-or-later

// Copyright 2026 Johnson Ogundeji


#include <emscripten.h>

#include <emscripten/bind.h>

#include <emscripten/val.h>


#include <cstdint>

#include <string>

#include <vector>


#include "signet/forge.hpp"


namespace em = emscripten;

using namespace signet::forge;


// ---------------------------------------------------------------------------

// MEMFS helpers

// ---------------------------------------------------------------------------


static constexpr unsigned MEMFS_MAX_FILE_SIZE = 256u * 1024u * 1024u;


static bool writeFileToMemfs(const std::string& path, const em::val& arrayBuffer) {

    auto view = em::val::global("Uint8Array").new_(arrayBuffer);

    auto len = view["length"].as<unsigned>();

    if (len > MEMFS_MAX_FILE_SIZE) {

        emscripten_log(EM_LOG_ERROR, "writeFileToMemfs: file too large (%u bytes, max %u)", len, MEMFS_MAX_FILE_SIZE);

        return false;

    }

    std::vector<uint8_t> buf(len);

    auto memView = em::val(em::typed_memory_view(len, buf.data()));

    memView.call<void>("set", view);

    EM_ASM({

        FS.writeFile(UTF8ToString($0), HEAPU8.subarray($1, $1 + $2));

    }, path.c_str(), buf.data(), static_cast<int>(len));

    return true;

}


static em::val readFileFromMemfs(const std::string& path) {

    em::val fs = em::val::module_property("FS");

    return fs.call<em::val>("readFile", path);

}


// ---------------------------------------------------------------------------

// Hex and minimal JSON helpers (for encryption key input)

// ---------------------------------------------------------------------------


static std::vector<uint8_t> hexToBytes(const std::string& hex) {

    std::vector<uint8_t> bytes;

    if (hex.size() % 2 != 0) return bytes;

    bytes.reserve(hex.size() / 2);

    for (size_t i = 0; i < hex.size(); i += 2) {

        auto hi = hex[i], lo = hex[i + 1];

        auto nibble = [](char c) -> int {

            if (c >= '0' && c <= '9') return c - '0';

            if (c >= 'a' && c <= 'f') return 10 + c - 'a';

            if (c >= 'A' && c <= 'F') return 10 + c - 'A';

            return -1;

        };

        int h = nibble(hi), l = nibble(lo);

        if (h < 0 || l < 0) return {};

        bytes.push_back(static_cast<uint8_t>((h << 4) | l));

    }

    return bytes;

}


static std::vector<std::pair<std::string, std::string>>

parseColumnKeys(const std::string& json) {

    std::vector<std::pair<std::string, std::string>> result;

    size_t i = json.find('{');

    if (i == std::string::npos) return result;

    ++i;

    auto skipWs = [&]() { while (i < json.size() && json[i] <= ' ') ++i; };

    auto readStr = [&]() -> std::string {

        skipWs();

        if (i >= json.size() || json[i] != '"') return {};

        ++i;

        std::string s;

        while (i < json.size() && json[i] != '"') {

            if (json[i] == '\\' && i + 1 < json.size()) {

                ++i; // skip backslash, take next char literally

            }

            s += json[i++];

        }

        if (i < json.size()) ++i; // skip closing quote

        return s;

    };

    while (i < json.size()) {

        skipWs();

        if (json[i] == '}') break;

        auto key = readStr();

        skipWs();

        if (i < json.size() && json[i] == ':') ++i;

        auto val = readStr();

        if (!key.empty()) result.emplace_back(std::move(key), std::move(val));

        skipWs();

        if (i < json.size() && json[i] == ',') ++i;

    }

    return result;

}


// ---------------------------------------------------------------------------

// Version

// ---------------------------------------------------------------------------


static std::string version() {

    return SIGNET_CREATED_BY;

}


// ---------------------------------------------------------------------------

// SchemaBuilder wrapper — chain-style API for JS

// ---------------------------------------------------------------------------


class WasmSchemaBuilder {

    SchemaBuilder builder_;

public:

    explicit WasmSchemaBuilder(const std::string& name) : builder_(name) {}


    WasmSchemaBuilder& addBool(const std::string& col)       { builder_.column<bool>(col);        return *this; }

    WasmSchemaBuilder& addInt32(const std::string& col)      { builder_.column<int32_t>(col);     return *this; }

    WasmSchemaBuilder& addInt64(const std::string& col)      { builder_.column<int64_t>(col);     return *this; }

    WasmSchemaBuilder& addFloat(const std::string& col)      { builder_.column<float>(col);       return *this; }

    WasmSchemaBuilder& addDouble(const std::string& col)     { builder_.column<double>(col);      return *this; }

    WasmSchemaBuilder& addString(const std::string& col)     { builder_.column<std::string>(col); return *this; }


    Schema build() { return builder_.build(); }

};


// ---------------------------------------------------------------------------

// Schema accessors (free functions bound onto the Schema class via embind)

// ---------------------------------------------------------------------------


static size_t schemaNumColumns(const Schema& s) { return s.num_columns(); }


static std::string schemaColumnName(const Schema& s, size_t i) {

    if (i >= s.num_columns()) return "";

    return s.column(i).name;

}


static int schemaColumnPhysicalType(const Schema& s, size_t i) {

    if (i >= s.num_columns()) return -1;

    return static_cast<int>(s.column(i).physical_type);

}


static std::string schemaName(const Schema& s) { return s.name(); }


static std::string physicalTypeName(int pt) {

    switch (static_cast<PhysicalType>(pt)) {

        case PhysicalType::BOOLEAN:              return "BOOLEAN";

        case PhysicalType::INT32:                return "INT32";

        case PhysicalType::INT64:                return "INT64";

        case PhysicalType::INT96:                return "INT96";

        case PhysicalType::FLOAT:                return "FLOAT";

        case PhysicalType::DOUBLE:               return "DOUBLE";

        case PhysicalType::BYTE_ARRAY:           return "BYTE_ARRAY";

        case PhysicalType::FIXED_LEN_BYTE_ARRAY: return "FIXED_LEN_BYTE_ARRAY";

        default:                                  return "UNKNOWN";

    }

}


static std::string logicalTypeName(int lt) {

    switch (static_cast<LogicalType>(lt)) {

        case LogicalType::NONE:          return "NONE";

        case LogicalType::STRING:        return "STRING";

        case LogicalType::ENUM:          return "ENUM";

        case LogicalType::UUID:          return "UUID";

        case LogicalType::DATE:          return "DATE";

        case LogicalType::TIME_MS:       return "TIME_MS";

        case LogicalType::TIME_US:       return "TIME_US";

        case LogicalType::TIME_NS:       return "TIME_NS";

        case LogicalType::TIMESTAMP_MS:  return "TIMESTAMP_MS";

        case LogicalType::TIMESTAMP_US:  return "TIMESTAMP_US";

        case LogicalType::TIMESTAMP_NS:  return "TIMESTAMP_NS";

        case LogicalType::DECIMAL:       return "DECIMAL";

        case LogicalType::JSON:          return "JSON";

        case LogicalType::BSON:          return "BSON";

        case LogicalType::FLOAT16:       return "FLOAT16";

        case LogicalType::FLOAT32_VECTOR: return "FLOAT32_VECTOR";

        default:                          return "UNKNOWN";

    }

}


static int schemaColumnLogicalType(const Schema& s, size_t i) {

    if (i >= s.num_columns()) return -1;

    return static_cast<int>(s.column(i).logical_type);

}


// ---------------------------------------------------------------------------

// WriterOptions wrapper

// ---------------------------------------------------------------------------


class WasmWriterOptions {

public:

    WriterOptions opts;


    WasmWriterOptions() = default;


    void setRowGroupSize(int64_t n) { opts.row_group_size = n; }


    int64_t getRowGroupSize() const { return opts.row_group_size; }

};


// ---------------------------------------------------------------------------

// ParquetWriter wrapper

// ---------------------------------------------------------------------------


class WasmParquetWriter {

    std::unique_ptr<ParquetWriter> writer_;

public:

    WasmParquetWriter() = default;


    bool open(const std::string& path, const Schema& schema, const WasmWriterOptions& opts) {

        auto result = ParquetWriter::open(path, schema, opts.opts);

        if (!result.has_value()) return false;

        writer_ = std::make_unique<ParquetWriter>(std::move(*result));

        return true;

    }


    bool writeColumnBool(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<bool> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<bool>();

        // bool write_column needs a raw bool array

        std::vector<uint8_t> raw(len);

        for (unsigned i = 0; i < len; ++i) raw[i] = buf[i] ? 1 : 0;

        return writer_->write_column<bool>(col, reinterpret_cast<const bool*>(raw.data()), len).has_value();

    }


    bool writeColumnInt32(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<int32_t> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<int32_t>();

        return writer_->write_column<int32_t>(col, buf.data(), len).has_value();

    }


    bool writeColumnInt64(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<int64_t> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<int64_t>();

        return writer_->write_column<int64_t>(col, buf.data(), len).has_value();

    }


    bool writeColumnFloat(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<float> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<float>();

        return writer_->write_column<float>(col, buf.data(), len).has_value();

    }


    bool writeColumnDouble(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<double> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<double>();

        return writer_->write_column<double>(col, buf.data(), len).has_value();

    }


    bool writeColumnString(size_t col, const em::val& arr) {

        if (!writer_ || col >= writer_->num_columns()) return false;

        auto len = arr["length"].as<unsigned>();

        std::vector<std::string> buf(len);

        for (unsigned i = 0; i < len; ++i) buf[i] = arr[i].as<std::string>();

        return writer_->write_column<std::string>(col, buf.data(), len).has_value();

    }


    bool flushRowGroup() {

        if (!writer_) return false;

        return writer_->flush_row_group().has_value();

    }


    bool close() {

        if (!writer_) return false;

        return writer_->close().has_value();

    }


    int64_t rowsWritten() const {

        return writer_ ? writer_->rows_written() : 0;

    }


    bool isOpen() const {

        return writer_ && writer_->is_open();

    }


};


// ---------------------------------------------------------------------------

// ParquetReader wrapper

// ---------------------------------------------------------------------------


class WasmParquetReader {

    std::unique_ptr<ParquetReader> reader_;

public:

    WasmParquetReader() = default;


    bool open(const std::string& path) {

        auto result = ParquetReader::open(path);

        if (!result.has_value()) return false;

        reader_ = std::make_unique<ParquetReader>(std::move(*result));

        return true;

    }


#if SIGNET_ENABLE_COMMERCIAL

    bool openEncrypted(const std::string& path,

                       const std::string& footerKeyHex,

                       const std::string& columnKeyHex,

                       const std::string& aadPrefix,

                       const std::string& columnKeysJson) {

        crypto::EncryptionConfig cfg;

        cfg.footer_key = hexToBytes(footerKeyHex);

        if (cfg.footer_key.size() != 32) return false;


        if (!columnKeyHex.empty()) {

            cfg.default_column_key = hexToBytes(columnKeyHex);

            if (cfg.default_column_key.size() != 32) return false;

        }


        if (!aadPrefix.empty()) {

            cfg.aad_prefix = aadPrefix;

        }


        if (!columnKeysJson.empty()) {

            auto keys = parseColumnKeys(columnKeysJson);

            for (auto& [name, hexKey] : keys) {

                crypto::ColumnKeySpec spec;

                spec.column_name = name;

                spec.key = hexToBytes(hexKey);

                if (spec.key.size() != 32) return false;

                cfg.column_keys.push_back(std::move(spec));

            }

        }


        auto result = ParquetReader::open(path, cfg);


        // Zero key material from WASM memory regardless of success/failure

        auto zero_vec = [](std::vector<uint8_t>& v) {

            if (!v.empty()) {

                volatile uint8_t* p = v.data();

                for (size_t i = 0; i < v.size(); ++i) p[i] = 0;

            }

            v.clear();

        };

        zero_vec(cfg.footer_key);

        zero_vec(cfg.default_column_key);

        for (auto& ck : cfg.column_keys) zero_vec(ck.key);


        if (!result.has_value()) return false;

        reader_ = std::make_unique<ParquetReader>(std::move(*result));

        return true;

    }

#endif


    int64_t numRows() const {

        return reader_ ? reader_->num_rows() : 0;

    }


    int64_t numRowGroups() const {

        return reader_ ? reader_->num_row_groups() : 0;

    }


    Schema schema() const {

        if (!reader_) return Schema{};

        return reader_->schema();

    }


    std::string createdBy() const {

        return reader_ ? reader_->created_by() : "";

    }


    em::val readColumnBool(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<bool>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


    em::val readColumnInt32(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<int32_t>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


    em::val readColumnInt64(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<int64_t>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", static_cast<double>((*result)[i]));

        return arr;

    }


    em::val readColumnFloat(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<float>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


    em::val readColumnDouble(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<double>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


    em::val readColumnString(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column<std::string>(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


    em::val readColumnAsStrings(size_t rg, size_t col) {

        if (!reader_) return em::val::array();

        auto result = reader_->read_column_as_strings(rg, col);

        if (!result.has_value()) return em::val::array();

        auto arr = em::val::array();

        for (size_t i = 0; i < result->size(); ++i)

            arr.call<void>("push", (*result)[i]);

        return arr;

    }


};


// ---------------------------------------------------------------------------

// Embind registrations

// ---------------------------------------------------------------------------


EMSCRIPTEN_BINDINGS(signet_forge) {

    // Free functions

    em::function("version", &version);

    em::function("physicalTypeName", &physicalTypeName);

    em::function("logicalTypeName", &logicalTypeName);

    em::function("writeFileToMemfs", &writeFileToMemfs);

    em::function("readFileFromMemfs", &readFileFromMemfs);


    // Schema

    em::class_<Schema>("Schema")

        .constructor<>()

        .function("numColumns", &schemaNumColumns)

        .function("columnName", &schemaColumnName)

        .function("columnPhysicalType", &schemaColumnPhysicalType)

        .function("columnLogicalType", &schemaColumnLogicalType)

        .function("name", &schemaName)

        ;


    // SchemaBuilder

    em::class_<WasmSchemaBuilder>("SchemaBuilder")

        .constructor<std::string>()

        .function("addBool",   &WasmSchemaBuilder::addBool)

        .function("addInt32",  &WasmSchemaBuilder::addInt32)

        .function("addInt64",  &WasmSchemaBuilder::addInt64)

        .function("addFloat",  &WasmSchemaBuilder::addFloat)

        .function("addDouble", &WasmSchemaBuilder::addDouble)

        .function("addString", &WasmSchemaBuilder::addString)

        .function("build",     &WasmSchemaBuilder::build)

        ;


    // WriterOptions

    em::class_<WasmWriterOptions>("WriterOptions")

        .constructor<>()

        .function("setRowGroupSize", &WasmWriterOptions::setRowGroupSize)

        .function("getRowGroupSize", &WasmWriterOptions::getRowGroupSize)

        ;


    // ParquetWriter

    em::class_<WasmParquetWriter>("ParquetWriter")

        .constructor<>()

        .function("open",              &WasmParquetWriter::open)

        .function("writeColumnBool",   &WasmParquetWriter::writeColumnBool)

        .function("writeColumnInt32",  &WasmParquetWriter::writeColumnInt32)

        .function("writeColumnInt64",  &WasmParquetWriter::writeColumnInt64)

        .function("writeColumnFloat",  &WasmParquetWriter::writeColumnFloat)

        .function("writeColumnDouble", &WasmParquetWriter::writeColumnDouble)

        .function("writeColumnString", &WasmParquetWriter::writeColumnString)

        .function("flushRowGroup",     &WasmParquetWriter::flushRowGroup)

        .function("close",            &WasmParquetWriter::close)

        .function("rowsWritten",      &WasmParquetWriter::rowsWritten)

        .function("isOpen",           &WasmParquetWriter::isOpen)

        ;


    // ParquetReader

    em::class_<WasmParquetReader>("ParquetReader")

        .constructor<>()

        .function("open",              &WasmParquetReader::open)

#if SIGNET_ENABLE_COMMERCIAL

        .function("openEncrypted",     &WasmParquetReader::openEncrypted)

#endif

        .function("numRows",          &WasmParquetReader::numRows)

        .function("numRowGroups",     &WasmParquetReader::numRowGroups)

        .function("schema",           &WasmParquetReader::schema)

        .function("createdBy",        &WasmParquetReader::createdBy)

        .function("readColumnBool",    &WasmParquetReader::readColumnBool)

        .function("readColumnInt32",   &WasmParquetReader::readColumnInt32)

        .function("readColumnInt64",   &WasmParquetReader::readColumnInt64)

        .function("readColumnFloat",   &WasmParquetReader::readColumnFloat)

        .function("readColumnDouble",  &WasmParquetReader::readColumnDouble)

        .function("readColumnString",  &WasmParquetReader::readColumnString)

        .function("readColumnAsStrings", &WasmParquetReader::readColumnAsStrings)

        ;

}


WasmParquetReader
JavaScript-facing Parquet reader.
Definition signet_wasm.cpp:409

WasmParquetReader::readColumnInt32
em::val readColumnInt32(size_t rg, size_t col)
Read an int32 column as a JS Array of numbers.
Definition signet_wasm.cpp:532

WasmParquetReader::readColumnFloat
em::val readColumnFloat(size_t rg, size_t col)
Read a float column as a JS Array of numbers.
Definition signet_wasm.cpp:554

WasmParquetReader::readColumnBool
em::val readColumnBool(size_t rg, size_t col)
Read a boolean column as a JS Array of booleans.
Definition signet_wasm.cpp:521

WasmParquetReader::open
bool open(const std::string &path)
Open a plaintext Parquet file from MEMFS.
Definition signet_wasm.cpp:418

WasmParquetReader::readColumnInt64
em::val readColumnInt64(size_t rg, size_t col)
Read an int64 column as a JS Array of doubles (JS has no native int64).
Definition signet_wasm.cpp:543

WasmParquetReader::numRowGroups
int64_t numRowGroups() const
Return the number of row groups in the file, or 0 if not open.
Definition signet_wasm.cpp:497

WasmParquetReader::readColumnString
em::val readColumnString(size_t rg, size_t col)
Read a string (BYTE_ARRAY) column as a JS Array of strings.
Definition signet_wasm.cpp:576

WasmParquetReader::WasmParquetReader
WasmParquetReader()=default
Default-construct in an unopened state.

WasmParquetReader::readColumnAsStrings
em::val readColumnAsStrings(size_t rg, size_t col)
Read any column as a JS Array of strings (type-erased).
Definition signet_wasm.cpp:595

WasmParquetReader::readColumnDouble
em::val readColumnDouble(size_t rg, size_t col)
Read a double column as a JS Array of numbers.
Definition signet_wasm.cpp:565

WasmParquetReader::schema
Schema schema() const
Return the file's schema, or an empty Schema if not open.
Definition signet_wasm.cpp:502

WasmParquetReader::numRows
int64_t numRows() const
Return total row count across all row groups, or 0 if not open.
Definition signet_wasm.cpp:492

WasmParquetReader::createdBy
std::string createdBy() const
Return the "created by" metadata string, or "" if not open.
Definition signet_wasm.cpp:508

WasmParquetWriter
JavaScript-facing Parquet writer.
Definition signet_wasm.cpp:290

WasmParquetWriter::flushRowGroup
bool flushRowGroup()
Flush the current row group to disk and begin a new one.
Definition signet_wasm.cpp:377

WasmParquetWriter::writeColumnInt32
bool writeColumnInt32(size_t col, const em::val &arr)
Write an int32 column from a JS array.
Definition signet_wasm.cpp:329

WasmParquetWriter::writeColumnBool
bool writeColumnBool(size_t col, const em::val &arr)
Write a boolean column from a JS array.
Definition signet_wasm.cpp:317

WasmParquetWriter::writeColumnString
bool writeColumnString(size_t col, const em::val &arr)
Write a string (BYTE_ARRAY) column from a JS array.
Definition signet_wasm.cpp:365

WasmParquetWriter::WasmParquetWriter
WasmParquetWriter()=default
Default-construct in an unopened state.

WasmParquetWriter::writeColumnInt64
bool writeColumnInt64(size_t col, const em::val &arr)
Write an int64 column from a JS array.
Definition signet_wasm.cpp:338

WasmParquetWriter::writeColumnDouble
bool writeColumnDouble(size_t col, const em::val &arr)
Write a double column from a JS array.
Definition signet_wasm.cpp:356

WasmParquetWriter::rowsWritten
int64_t rowsWritten() const
Return the total number of rows written so far (across all row groups).
Definition signet_wasm.cpp:390

WasmParquetWriter::close
bool close()
Finalize the Parquet file (writes footer metadata and closes the file).
Definition signet_wasm.cpp:384

WasmParquetWriter::isOpen
bool isOpen() const
Check whether the writer is currently open and accepting data.
Definition signet_wasm.cpp:395

WasmParquetWriter::writeColumnFloat
bool writeColumnFloat(size_t col, const em::val &arr)
Write a float column from a JS array.
Definition signet_wasm.cpp:347

WasmParquetWriter::open
bool open(const std::string &path, const Schema &schema, const WasmWriterOptions &opts)
Open a new Parquet file for writing on MEMFS.
Definition signet_wasm.cpp:301

WasmSchemaBuilder
Fluent Parquet schema builder exposed to JavaScript.
Definition signet_wasm.cpp:164

WasmSchemaBuilder::addInt64
WasmSchemaBuilder & addInt64(const std::string &col)
Definition signet_wasm.cpp:179

WasmSchemaBuilder::addBool
WasmSchemaBuilder & addBool(const std::string &col)
Definition signet_wasm.cpp:177

WasmSchemaBuilder::build
Schema build()
Finalize and return the immutable Schema object.
Definition signet_wasm.cpp:186

WasmSchemaBuilder::addInt32
WasmSchemaBuilder & addInt32(const std::string &col)
Definition signet_wasm.cpp:178

WasmSchemaBuilder::addDouble
WasmSchemaBuilder & addDouble(const std::string &col)
Definition signet_wasm.cpp:181

WasmSchemaBuilder::WasmSchemaBuilder
WasmSchemaBuilder(const std::string &name)
Construct a new schema builder.
Definition signet_wasm.cpp:169

WasmSchemaBuilder::addString
WasmSchemaBuilder & addString(const std::string &col)
Definition signet_wasm.cpp:182

WasmSchemaBuilder::addFloat
WasmSchemaBuilder & addFloat(const std::string &col)
Definition signet_wasm.cpp:180

WasmWriterOptions
Thin wrapper around core WriterOptions for JavaScript consumption.
Definition signet_wasm.cpp:266

WasmWriterOptions::opts
WriterOptions opts
Underlying writer options struct.
Definition signet_wasm.cpp:268

WasmWriterOptions::getRowGroupSize
int64_t getRowGroupSize() const
Get the current row group size setting.
Definition signet_wasm.cpp:278

WasmWriterOptions::WasmWriterOptions
WasmWriterOptions()=default
Construct with default options.

WasmWriterOptions::setRowGroupSize
void setRowGroupSize(int64_t n)
Set the target row group size (number of rows per group).
Definition signet_wasm.cpp:275

signet::forge::ParquetReader::open
static expected< ParquetReader > open(const std::filesystem::path &path)
Open and parse a Parquet file, returning a ready-to-query reader.
Definition reader.hpp:189

signet::forge::ParquetWriter::open
static expected< ParquetWriter > open(const std::filesystem::path &path, const Schema &schema, const Options &options=Options{})
Open a new Parquet file for writing.
Definition writer.hpp:303

signet::forge::SchemaBuilder
Fluent builder for constructing a Schema one column at a time.
Definition schema.hpp:92

signet::forge::SchemaBuilder::column
SchemaBuilder & column(std::string col_name, LogicalType logical_type=LogicalType::NONE)
Add a typed column, deducing PhysicalType from T.
Definition schema.hpp:107

signet::forge::SchemaBuilder::build
Schema build()
Build the final Schema, consuming the builder.
Definition schema.hpp:303

signet::forge::Schema
Immutable schema description for a Parquet file.
Definition schema.hpp:192

signet::forge::Schema::num_columns
size_t num_columns() const
Number of columns in this schema.
Definition schema.hpp:238

signet::forge::Schema::name
const std::string & name() const
Root schema name (e.g. "tick_data").
Definition schema.hpp:235

signet::forge::Schema::column
const ColumnDescriptor & column(size_t index) const
Access a column descriptor by index.
Definition schema.hpp:244

forge.hpp
Single-include umbrella header for the Signet Forge library.

signet::forge
Definition audit_chain.hpp:74

signet::forge::SIGNET_CREATED_BY
constexpr const char * SIGNET_CREATED_BY
Default "created_by" string embedded in every Parquet footer.
Definition types.hpp:203

signet::forge::PhysicalType
PhysicalType
Parquet physical (storage) types as defined in parquet.thrift.
Definition types.hpp:20

signet::forge::LogicalType
LogicalType
Parquet logical types (from parquet.thrift LogicalType union).
Definition types.hpp:41

EMSCRIPTEN_BINDINGS
EMSCRIPTEN_BINDINGS(signet_forge)
Emscripten embind registration block.
Definition signet_wasm.cpp:617

signet::forge::ColumnDescriptor::logical_type
LogicalType logical_type
Semantic annotation (STRING, TIMESTAMP_NS, etc.).
Definition types.hpp:155

signet::forge::ColumnDescriptor::name
std::string name
Column name (unique within a schema).
Definition types.hpp:153

signet::forge::ColumnDescriptor::physical_type
PhysicalType physical_type
On-disk storage type.
Definition types.hpp:154

signet::forge::WriterOptions
Configuration options for ParquetWriter.
Definition writer.hpp:188

signet::forge::WriterOptions::row_group_size
int64_t row_group_size
Target number of rows per row group.
Definition writer.hpp:192

signet::forge::crypto::ColumnKeySpec
Specifies the encryption key for a single Parquet column.
Definition key_metadata.hpp:142

signet::forge::crypto::ColumnKeySpec::column_name
std::string column_name
Parquet column path (e.g. "a.b.c").
Definition key_metadata.hpp:143

signet::forge::crypto::ColumnKeySpec::key
std::vector< uint8_t > key
32-byte AES-256 key (INTERNAL mode).
Definition key_metadata.hpp:144

signet::forge::crypto::EncryptionConfig
Top-level configuration structure that drives FileEncryptor / FileDecryptor.
Definition key_metadata.hpp:157

signet::forge::crypto::EncryptionConfig::default_column_key
std::vector< uint8_t > default_column_key
Default column key (32 bytes).
Definition key_metadata.hpp:181

signet::forge::crypto::EncryptionConfig::footer_key
std::vector< uint8_t > footer_key
32-byte AES-256 key for encrypting the Parquet footer (FileMetaData).
Definition key_metadata.hpp:164

signet::forge::crypto::EncryptionConfig::aad_prefix
std::string aad_prefix
AAD prefix – typically a file identifier or URI.
Definition key_metadata.hpp:208

signet::forge::crypto::EncryptionConfig::column_keys
std::vector< ColumnKeySpec > column_keys
Per-column key specifications. Columns listed here get their own key.
Definition key_metadata.hpp:176