OpenSourceJavaProject
diff --git a/‎go/internal/utils/buf_reader.go‎
Lines changed: 195 additions & 0 deletions b/‎go/internal/utils/buf_reader.go‎
Lines changed: 195 additions & 0 deletions
diff --git a/‎go/parquet/file/column_writer_test.go‎
Lines changed: 2 additions & 1 deletion b/‎go/parquet/file/column_writer_test.go‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎go/parquet/file/file_reader_test.go‎
Lines changed: 2 additions & 1 deletion b/‎go/parquet/file/file_reader_test.go‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎go/parquet/file/page_reader.go‎
Lines changed: 9 additions & 20 deletions b/‎go/parquet/file/page_reader.go‎
Lines changed: 9 additions & 20 deletions
diff --git a/‎go/parquet/internal/encryption/aes.go‎
Lines changed: 46 additions & 0 deletions b/‎go/parquet/internal/encryption/aes.go‎
Lines changed: 46 additions & 0 deletions
@@ -0,0 +1,195 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+// http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+
+package utils
+
+import (
+	"errors"
+	"io"
+)
+
+// bufferedReader is similar to bufio.Reader except
+// it will expand the buffer if necessary when asked to Peek
+// more bytes than are in the buffer
+type bufferedReader struct {
+	bufferSz int
+	buf      []byte
+	r, w     int
+	rd       io.Reader
+	err      error
+}
+
+func NewBufferedReader(rd io.Reader, sz int) *bufferedReader {
+	b, ok := rd.(*bufferedReader)
+	if ok && len(b.buf) >= sz {
+		return b
+	}
+
+	r := &bufferedReader{
+		rd: rd,
+	}
+	r.resizeBuffer(sz)
+	return r
+}
+
+func (b *bufferedReader) resetBuffer() {
+	if b.buf == nil {
+		b.buf = make([]byte, b.bufferSz)
+	} else if b.bufferSz > cap(b.buf) {
+		buf := b.buf
+		b.buf = make([]byte, b.bufferSz)
+		copy(b.buf, buf)
+	} else {
+		b.buf = b.buf[:b.bufferSz]
+	}
+}
+
+func (b *bufferedReader) resizeBuffer(newSize int) {
+	b.bufferSz = newSize
+	b.resetBuffer()
+}
+
+func (b *bufferedReader) fill() {
+	// slide existing data to the beginning
+	if b.r > 0 {
+		copy(b.buf, b.buf[b.r:b.w])
+		b.w -= b.r
+		b.r = 0
+	}
+
+	if b.w >= len(b.buf) {
+		panic("parquet/bufio: tried to fill full buffer")
+	}
+
+	n, err := io.ReadAtLeast(b.rd, b.buf[b.w:], 1)
+	if n < 0 {
+		panic("negative read")
+	}
+
+	b.w += n
+	b.err = err
+}
+
+func (b *bufferedReader) readErr() error {
+	err := b.err
+	b.err = nil
+	return err
+}
+
+func (b *bufferedReader) Buffered() int { return b.w - b.r }
+
+func (b *bufferedReader) SetBufferSize(newSize int) error {
+	if newSize <= 0 {
+		return errors.New("buffer size should be positive")
+	}
+
+	if b.w >= newSize {
+		return errors.New("cannot shrink read buffer if buffered data remains")
+	}
+
+	b.resizeBuffer(newSize)
+	return nil
+}
+
+func (b *bufferedReader) Peek(n int) ([]byte, error) {
+	if n < 0 {
+		return nil, errors.New("parquet/bufio: negative count")
+	}
+
+	if n > len(b.buf) {
+		if err := b.SetBufferSize(n); err != nil {
+			return nil, err
+		}
+	}
+
+	for b.w-b.r < n && b.w-b.r < len(b.buf) && b.err == nil {
+		b.fill() // b.w-b.r < len(b.buf) => buffer is not full
+	}
+
+	return b.buf[b.r : b.r+n], b.readErr()
+}
+
+func (b *bufferedReader) Discard(n int) (discarded int, err error) {
+	if n < 0 {
+		return 0, errors.New("negative count")
+	}
+
+	if n == 0 {
+		return
+	}
+
+	remain := n
+	for {
+		skip := b.Buffered()
+		if skip == 0 {
+			b.fill()
+			skip = b.Buffered()
+		}
+		if skip > remain {
+			skip = remain
+		}
+		b.r += skip
+		remain -= skip
+		if remain == 0 {
+			return n, nil
+		}
+		if b.err != nil {
+			return n - remain, b.readErr()
+		}
+	}
+}
+
+func (b *bufferedReader) Read(p []byte) (n int, err error) {
+	n = len(p)
+	if n == 0 {
+		if b.Buffered() > 0 {
+			return 0, nil
+		}
+		return 0, b.readErr()
+	}
+
+	if b.r == b.w {
+		if b.err != nil {
+			return 0, b.readErr()
+		}
+		if len(p) >= len(b.buf) {
+			// large read, empty buffer
+			// read directly into p to avoid extra copy
+			n, b.err = b.rd.Read(p)
+			if n < 0 {
+				panic("negative read")
+			}
+			return n, b.readErr()
+		}
+
+		// one read
+		// don't use b.fill
+		b.r, b.w = 0, 0
+		n, b.err = b.rd.Read(b.buf)
+		if n < 0 {
+			panic("negative read")
+		}
+		if n == 0 {
+			return 0, b.readErr()
+		}
+		b.w += n
+	}
+
+	// copy as much as we can
+	n = copy(p, b.buf[b.r:b.w])
+	b.r += n
+	return n, nil
+}
@@ -24,6 +24,7 @@ import (
 
 	"github.com/apache/arrow/go/v8/arrow/bitutil"
 	"github.com/apache/arrow/go/v8/arrow/memory"
+	arrutils "github.com/apache/arrow/go/v8/internal/utils"
 	"github.com/apache/arrow/go/v8/parquet"
 	"github.com/apache/arrow/go/v8/parquet/compress"
 	"github.com/apache/arrow/go/v8/parquet/file"
@@ -233,7 +234,7 @@ func (p *PrimitiveWriterTestSuite) SetupTest() {
 
 func (p *PrimitiveWriterTestSuite) buildReader(nrows int64, compression compress.Compression) file.ColumnChunkReader {
 	p.readbuffer = p.sink.Finish()
-	pagereader, _ := file.NewPageReader(bytes.NewReader(p.readbuffer.Bytes()), nrows, compression, mem, nil)
+	pagereader, _ := file.NewPageReader(arrutils.NewBufferedReader(bytes.NewReader(p.readbuffer.Bytes()), p.readbuffer.Len()), nrows, compression, mem, nil)
 	return file.NewColumnReader(p.descr, pagereader, mem)
 }
 
 
@@ -24,6 +24,7 @@ import (
 	"testing"
 
 	"github.com/apache/arrow/go/v8/arrow/memory"
+	"github.com/apache/arrow/go/v8/internal/utils"
 	"github.com/apache/arrow/go/v8/parquet/compress"
 	"github.com/apache/arrow/go/v8/parquet/file"
 	"github.com/apache/arrow/go/v8/parquet/internal/encoding"
@@ -101,7 +102,7 @@ func (p *PageSerdeSuite) SetupTest() {
 func (p *PageSerdeSuite) InitSerializedPageReader(nrows int64, codec compress.Compression) {
 	p.EndStream()
 
-	p.pageReader, _ = file.NewPageReader(bytes.NewReader(p.buffer.Bytes()), nrows, codec, memory.DefaultAllocator, nil)
+	p.pageReader, _ = file.NewPageReader(utils.NewBufferedReader(bytes.NewReader(p.buffer.Bytes()), p.buffer.Len()), nrows, codec, memory.DefaultAllocator, nil)
 }
 
 func (p *PageSerdeSuite) WriteDataPageHeader(maxSerialized int, uncompressed, compressed int32) {
 
@@ -46,7 +46,7 @@ type PageReader interface {
 	// nil if there was no error and you just hit the end of the page
 	Err() error
 	// Reset allows reusing a page reader
-	Reset(r io.ReadSeeker, nrows int64, compressType compress.Compression, ctx *CryptoContext)
+	Reset(r parquet.BufferedReader, nrows int64, compressType compress.Compression, ctx *CryptoContext)
 }
 
 // Page is an interface for handling DataPages or Dictionary Pages
@@ -289,7 +289,7 @@ func (d *DictionaryPage) Release() {
 func (d *DictionaryPage) IsSorted() bool { return d.sorted }
 
 type serializedPageReader struct {
-	r        io.ReadSeeker
+	r        parquet.BufferedReader
 	nrows    int64
 	rowsSeen int64
 	mem      memory.Allocator
@@ -310,7 +310,7 @@ type serializedPageReader struct {
 }
 
 // NewPageReader returns a page reader for the data which can be read from the provided reader and compression.
-func NewPageReader(r io.ReadSeeker, nrows int64, compressType compress.Compression, mem memory.Allocator, ctx *CryptoContext) (PageReader, error) {
+func NewPageReader(r parquet.BufferedReader, nrows int64, compressType compress.Compression, mem memory.Allocator, ctx *CryptoContext) (PageReader, error) {
 	if mem == nil {
 		mem = memory.NewGoAllocator()
 	}
@@ -336,10 +336,10 @@ func NewPageReader(r io.ReadSeeker, nrows int64, compressType compress.Compressi
 	return rdr, nil
 }
 
-func (p *serializedPageReader) Reset(r io.ReadSeeker, nrows int64, compressType compress.Compression, ctx *CryptoContext) {
-	p.rowsSeen, p.pageOrd = 0, 0
+func (p *serializedPageReader) Reset(r parquet.BufferedReader, nrows int64, compressType compress.Compression, ctx *CryptoContext) {
+	p.rowsSeen, p.pageOrd, p.nrows = 0, 0, nrows
 	p.curPageHdr, p.curPage, p.err = nil, nil, nil
-	p.r, p.nrows = r, nrows
+	p.r = r
 
 	p.codec, p.err = compress.GetCodec(compressType)
 	if p.err != nil {
@@ -390,7 +390,6 @@ func (p *serializedPageReader) Page() Page {
 }
 
 func (p *serializedPageReader) decompress(lenCompressed int, buf []byte) ([]byte, error) {
-	p.decompressBuffer.Reset()
 	p.decompressBuffer.Grow(lenCompressed)
 	if _, err := io.CopyN(&p.decompressBuffer, p.r, int64(lenCompressed)); err != nil {
 		return nil, err
@@ -444,28 +443,19 @@ func (p *serializedPageReader) Next() bool {
 	p.err = nil
 
 	for p.rowsSeen < p.nrows {
-		// headerSize := 0
 		allowedPgSz := defaultPageHeaderSize
-
-		start, _ := p.r.Seek(0, io.SeekCurrent)
 		p.decompressBuffer.Reset()
-		// Page headers can be very large because of page statistics
-		// We try to deserialize a larger buffer progressively
-		// until a maximum allowed header limit
 		for {
-			n, err := io.CopyN(&p.decompressBuffer, p.r, int64(allowedPgSz))
-			// view, err := p.r.Peek(allowedPgSz)
+			view, err := p.r.Peek(allowedPgSz)
 			if err != nil && err != io.EOF {
 				p.err = err
 				return false
 			}
 
-			if n == 0 {
+			if len(view) == 0 {
 				return false
 			}
 
-			view := p.decompressBuffer.Bytes()
-
 			extra := 0
 			if p.cryptoCtx.MetaDecryptor != nil {
 				p.updateDecryption(p.cryptoCtx.MetaDecryptor, encryption.DictPageHeaderModule, p.dataPageHeaderAad)
@@ -483,7 +473,7 @@ func (p *serializedPageReader) Next() bool {
 				continue
 			}
 
-			p.r.Seek(start+int64(len(view)-int(remaining)+extra), io.SeekStart)
+			p.r.Discard(len(view) - int(remaining) + extra)
 			break
 		}
 
@@ -519,7 +509,6 @@ func (p *serializedPageReader) Next() bool {
 				return false
 			}
 
-			// p.buf.Resize(lenUncompressed)
 			// make dictionary page
 			p.curPage = &DictionaryPage{
 				page: page{
 
@@ -191,6 +191,52 @@ func newAesDecryptor(alg parquet.Cipher, metadata bool) *aesDecryptor {
 // the length of the plaintext after decryption.
 func (a *aesDecryptor) CiphertextSizeDelta() int { return a.ciphertextSizeDelta }
 
+// DecryptFrom
+func (a *aesDecryptor) DecryptFrom(r io.Reader, key, aad []byte) []byte {
+	block, err := aes.NewCipher(key)
+	if err != nil {
+		panic(err)
+	}
+
+	var writtenCiphertextLen uint32
+	if err := binary.Read(r, binary.LittleEndian, &writtenCiphertextLen); err != nil {
+		panic(err)
+	}
+
+	cipherText := make([]byte, writtenCiphertextLen)
+	if n, err := io.ReadFull(r, cipherText); n != int(writtenCiphertextLen) || err != nil {
+		panic(err)
+	}
+
+	nonce := cipherText[:NonceLength]
+	cipherText = cipherText[NonceLength:]
+	if a.mode == gcmMode {
+		aead, err := cipher.NewGCM(block)
+		if err != nil {
+			panic(err)
+		}
+
+		plain, err := aead.Open(cipherText[:0], nonce, cipherText, aad)
+		if err != nil {
+			panic(err)
+		}
+		return plain
+	}
+
+	// Parquet CTR IVs are comprised of a 12-byte nonce and a 4-byte initial
+	// counter field.
+	// The first 31 bits of the initial counter field are set to 0, the last bit
+	// is set to 1.
+	iv := make([]byte, ctrIVLen)
+	copy(iv, nonce)
+	iv[ctrIVLen-1] = 1
+
+	stream := cipher.NewCTR(block, iv)
+	// dst := make([]byte, len(cipherText))
+	stream.XORKeyStream(cipherText, cipherText)
+	return cipherText
+}
+
 // Decrypt returns the plaintext version of the given ciphertext when decrypted
 // with the provided key and AAD security bytes.
 func (a *aesDecryptor) Decrypt(cipherText, key, aad []byte) []byte {