Yet Another CPAN Grep

EAI-Wrap/lib/EAI/DB.pm

package EAI::DB 1.919;

use strict; use feature 'unicode_strings'; use warnings;
use Exporter qw(import); use DBI qw(:sql_types); use DBD::ODBC (); use Data::Dumper qw(Dumper); use Log::Log4perl qw(get_logger); use Carp qw(confess longmess);

our @EXPORT = qw(newDBH beginWork commit rollback readFromDB readFromDBHash doInDB storeInDB deleteFromDB updateInDB getConn setConn);

my $dbh; # current DBI handle
my $DSN = ""; # current DSN string

# create a new handle for a database connection
sub newDBH ($$) {
	my ($DB,$newDSN) = @_;
	my $logger = get_logger();
	if ($DSN ne $newDSN or !defined($dbh)) {
		$DSN = $newDSN;
		$logger->debug("DSN: $DSN");
		$dbh->disconnect() if defined($dbh);
		# AutoCommit=>0 is not done here, as beginWork calls $dbh->begin_work, which does this.
		$dbh = DBI->connect("dbi:ODBC:$DSN",undef,undef,{PrintError=>0,RaiseError=>0}) or do {
			$logger->error("DB connection error:".$DBI::errstr.",DSN:".$DSN.longmess());
			undef $dbh;
			return 0;
		};
		$dbh->{LongReadLen} = ($DB->{longreadlen} ? $DB->{longreadlen} : 1024);
		$logger->info("new DB connection established");
	} else {
		$logger->info("DB connection already open, using $DSN");
		return 1;
	}
}

# start transaction in database
sub beginWork {
	my $logger = get_logger();
	if (!defined($dbh)) {
		$logger->error("no valid dbh connection available".longmess());
		return 0;
	}
	$dbh->begin_work or do {$logger->error($DBI::errstr.longmess()); return 0};
	return 1;
}

# commit transaction in database
sub commit {
	my $logger = get_logger();
	if (!defined($dbh)) {
		$logger->error("no valid dbh connection available".longmess());
		return 0;
	}
	$dbh->commit or do {$logger->error($DBI::errstr.longmess()); return 0};
	return 1;
}

# roll back transaction in database
sub rollback {
	my $logger = get_logger();
	if (!defined($dbh)) {
		$logger->error("no valid dbh connection available".longmess());
		return 0;
	}
	$dbh->rollback or do {$logger->error($DBI::errstr.longmess()); return 0};
	return 1;
}

# read data into array returned in $data
sub readFromDB ($$) {
	my ($DB, $data) = @_;
	my $logger = get_logger();
	my $statement = $DB->{query};

	eval {
		confess "no ref to hash argument param given ({query=>''})" if ref($DB) ne "HASH";
		confess "no ref to array argument data (for returning data) given" if ref($data) ne "ARRAY";
		confess "no valid dbh connection available" if !defined($dbh);
		confess "no statement (hashkey query) given" if (!$statement);
		$logger->debug("statement: ".$statement);
		$dbh->{RaiseError} = 1; # to enable following try/catch (eval)
		eval {
			my $sth = $dbh->prepare($statement);
			$sth->execute();
			@{$DB->{columnnames}} = @{$sth->{NAME}} if $sth->{NAME}; # take field names from the statement handle of query, used for later processing
			@$data = @{$sth->fetchall_arrayref({})};
		};
		confess "$@, executed statement: $statement " if ($@);
	};
	$dbh->{RaiseError} = 0;
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("columns:".Dumper($DB->{columnnames}).",retrieved data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# read data into hash using columns $DB->{keyfields} as the unique key for the hash (used for lookups), returned in $data
sub readFromDBHash ($$) {
	my ($DB, $data) = @_;
	my $logger = get_logger();
	my $statement = $DB->{query};
	my @keyfields = @{$DB->{keyfields}} if $DB->{keyfields} and ref($DB->{keyfields}) eq "ARRAY";
	eval {
		confess "no ref to hash argument param given ({query=>'',keyfields=>[]})" if ref($DB) ne "HASH";
		confess "no ref to hash argument data (for returning data) given" if ref($data) ne "HASH";
		confess "no valid dbh connection available" if !defined($dbh);
		confess "no statement (hashkey query) given" if (!$statement);
		confess "no key fields list (hashkey keyfields) given" if (!@keyfields);
		$logger->debug("statement: ".$statement.", keyfields: @keyfields");
		$dbh->{RaiseError} = 1; # to enable following try/catch (eval)
		eval {
			my $sth = $dbh->prepare($statement);
			$sth->execute();
			@{$DB->{columnnames}} = @{$sth->{NAME}} if $sth->{NAME}; # take field names from the statement handle of query, used for later processing
			%$data = %{$sth->fetchall_hashref(@keyfields)};
		};
		confess $@.",DB error: ".$DBI::errstr." executed statement: ".$statement if ($@);
	};
	$dbh->{RaiseError} = 0;
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("columns:".Dumper($DB->{columnnames}).",retrieved data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# do general statement $DB->{doString} in database using optional parameters passed in array ref $DB->{parameters}, optionally passing back values in $data
sub doInDB ($;$) {
	my ($DB, $data) = @_;
	my $logger = get_logger();
	eval {
		confess "no param hash argument ({doString=>'',parameters=>...}) given" if ref($DB) ne "HASH";
		confess "no valid dbh connection available" if !defined($dbh);
		confess "no sql statement doString given" if !$DB->{doString};
		my $doString = $DB->{doString};
		my @parameters;
		if ($DB->{parameters}) {
			if (ref($DB->{parameters}) eq "ARRAY") {
				@parameters = @{$DB->{parameters}};
			} else {
				confess "sub argument parameters not ref to array";
			}
		}
		$logger->debug("do in DB: ".Dumper($DB));
		$dbh->{odbc_ignore_named_placeholders} = 1 if $DB->{odbc_ignore_named_placeholders};
		my $sth = $dbh->prepare($doString);
		if (@parameters == 0) {
			$sth->execute();
		} else {
			$sth->execute(@parameters);
		}
		confess $@.",DB error: ".$sth->errstr." statement: ".$doString if $sth->err;
		# return record set of statement if possible/required
		if (defined($data)) {
			if (ref($data) eq "ARRAY") {
				@$data =();
				do {
					push @$data, $sth->fetchall_arrayref({});
				} while ($sth->{odbc_more_results});
			} else {
				confess "argument \$data not ref to array, can't pass back results";
			}
		}
	};
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("returned data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# store row-based data into database, using insert or "upsert" technique
sub storeInDB ($$;$) {
	my ($DB, $data, $countPercent) = @_;
	my $logger = get_logger();
	my $tableName = $DB->{tablename};
	my $addID = $DB->{addID};
	my $upsert= $DB->{upsert};
	my $primkey = $DB->{primkey};
	my $ignoreDuplicateErrs = $DB->{ignoreDuplicateErrs};
	my $deleteBeforeInsertSelector = $DB->{deleteBeforeInsertSelector};
	my $incrementalStore = $DB->{incrementalStore};
	my $doUpdateBeforeInsert = $DB->{doUpdateBeforeInsert};
	my $debugKeyIndicator = $DB->{debugKeyIndicator};
	my $dontKeepContent= $DB->{dontKeepContent};

	eval {
		no warnings 'uninitialized';
		my @keycolumns = split "AND", $primkey;
		map { s/=//; s/\?//; s/ //g;} @keycolumns;
		$logger->debug("tableName:$tableName,addID:$addID,upsert:$upsert,primkey:$primkey,ignoreDuplicateErrs:$ignoreDuplicateErrs,deleteBeforeInsertSelector:$deleteBeforeInsertSelector,incrementalStore:$incrementalStore,doUpdateBeforeInsert:$doUpdateBeforeInsert,debugKeyIndicator:$debugKeyIndicator");
		confess "no valid dbh connection available" if !defined($dbh);
		confess "no tablename given" if !$tableName;
		confess "no primkey given for upsert" if (!$primkey and $upsert);
		confess "neither primkey nor deleteBeforeInsertSelector given" if (!$primkey and !$deleteBeforeInsertSelector and !$dontKeepContent);
		my $schemaName = $DB->{schemaName};
		if ($tableName =~ /\./) {
			$logger->debug("getting schema from $tableName (contains dot)");
			($schemaName, $tableName) = ($tableName =~ /(.*)\.(.*)/);
		}
		confess "no schemaName available (neither from tablename containing schema nor from parameter schemaName" if !$schemaName;
		my $colh = $dbh->column_info('', $schemaName, $tableName, "%");
		my $coldefs = $colh->fetchall_hashref("COLUMN_NAME");
		confess "no field definitions found for $schemaName.$tableName using DSN $DSN" if scalar(keys %{$coldefs}) == 0; # no more information can be given as column_info is just a select on information store..
		$logger->trace("coldefs:\n".Dumper($coldefs)) if $logger->is_trace;
		my %IDName;
		if ($addID) {
			confess "no valid addID given (needs to be ref to hash, key=fieldname, value=ID)!" if ref($addID) ne 'HASH';
			$IDName{$_} = 1 for (keys %{$addID});
		}
		my $i=0; my @columns;
		$logger->trace("type info:\n".Dumper($dbh->type_info("SQL_ALL_TYPES"))) if $logger->is_trace; # all available data type informations of DBD:ODBC driver
		for (keys %{$coldefs}) {
			if ($coldefs->{$_}{"COLUMN_DEF"} =~ /identity/ or $coldefs->{$_}{"TYPE_NAME"} =~ /identity/) { # for identity (auto incrementing) fields no filling needed
				$logger->debug("TYPE_NAME for identity field ".$_.':'.$coldefs->{$_}{"TYPE_NAME"}) if $logger->is_debug;
			} else {
				$columns[$i]= $_;
				$logger->debug("TYPE_NAME for normal field ".$columns[$i].':'.$coldefs->{$columns[$i]}{"TYPE_NAME"}) if $logger->is_debug;
				$i++;
			}
		}
		# is the given field (header) in table? warn, if not
		for my $dataheader (keys %{$data->[0]}) {
			$logger->warn("field '".$dataheader."' not contained in table $schemaName.$tableName") if !$coldefs->{$dataheader} && !$DB->{dontWarnOnNotExistingFields};
		}
		$dbh->{PrintError} = 0; $dbh->{RaiseError} = 0;
		my $lines = scalar(@{$data});
		if ($lines > 0) {
			my %beforeInsert; # hash flag for update before insert (first row where data appears)
			my $keyValueForDeleteBeforeInsert;
			# row-wise processing data ($i)
			for (my $i=0; $i<$lines; $i++) {
				my @dataArray; # row data that is prepared for insert/update, formatted by the type as defined in DB
				my $inscols; my $inscolVals; my $updcols; my $updselector = $primkey; # for building insert and update statements
				my $tgtCol=0; # separate target column iterator for dataArray to allow for skipping columns with $incrementalStore !
				$debugKeyIndicator = $primkey if !$debugKeyIndicator; # $debugKeyIndicator is primary if not given
				my $debugKey = $debugKeyIndicator if $debugKeyIndicator; # $debugKey is the actual value of the debug key
				$debugKey = "neither primkey nor debugKeyIndicator given, no information possible here" if !$debugKey;
				my ($errorIndicator,$severity); # collect error messages

				# iterate table fields, check data by type and format accordingly
				for (my $dbCol=0; $dbCol < scalar(@{columns}); $dbCol++) {
					$logger->trace("passed data:\n".Dumper($data->[$i])) if $logger->is_trace;
					$dataArray[$tgtCol] = $data->[$i]{$columns[$dbCol]}; # first fill with raw data
					$dataArray[$tgtCol] = $addID->{$columns[$dbCol]} if $IDName{$columns[$dbCol]}; # if given: add constant ID-field value to all data rows for ID
					my $datatype = $coldefs->{$columns[$dbCol]}{"TYPE_NAME"}; # type from DB dictionary
					my $datasize = $coldefs->{$columns[$dbCol]}{"COLUMN_SIZE"}; # size from DB dictionary
					# numerical types:
					if ($datatype =~ /^numeric/ or $datatype =~ /^float/ or $datatype =~ /real/ or $datatype =~ /^smallmoney/ or $datatype =~ /^money/ or $datatype =~ /^decimal/ or $datatype =~ /^tinyint/ or $datatype =~ /^smallint/ or $datatype =~ /^int/  or $datatype =~ /^bigint/) {
						# in case we have trailing 0s after comma, get rid of them for integer fields
						$dataArray[$tgtCol] =~ s/\.0+$// if $dataArray[$tgtCol] =~ /\d+\.0+$/;
						# in case of postfix minus (SAP Convention), revert that to prefix ...
						$dataArray[$tgtCol] =~ s/([\d\.]*)-/-$1/ if $dataArray[$tgtCol] =~ /[\d\.]*-$/;
						# in case of numeric data, prevent any nonnumeric input...
						$dataArray[$tgtCol] =~ s/%$// if $dataArray[$tgtCol] =~ /[\d\.]*%$/; # get rid of percent sign
						# ignore everything that doesn't look like a numeric (also respecting scientific notation (E...)). 
						# decimal place before comma is optional, at least one decimal digit is needed (but also integers are possible)
						$dataArray[$tgtCol] = undef if !($dataArray[$tgtCol] =~ /^-*\d*\.?\d+(E[-+])*\d*$/);
						$dataArray[$tgtCol] = undef if $dataArray[$tgtCol] =~ /^N\/A$/;
						# smallest possible double for sql server = 1.79E-308
						$dataArray[$tgtCol] = 0 if abs($dataArray[$tgtCol]) <= 1.79E-308 and abs($dataArray[$tgtCol]) > 0;
					# boolean, convert text to 0 and 1.
					} elsif ($datatype =~ /^bit/) {
						$dataArray[$tgtCol] =~ s/WAHR/1/i;
						$dataArray[$tgtCol] =~ s/FALSCH/0/i;
						$dataArray[$tgtCol] =~ s/TRUE/1/i;
						$dataArray[$tgtCol] =~ s/FALSE/0/i;
					# date/time
					} elsif ($datatype =~ /^date/ or $datatype =~ /^time/) {
						# prevent non date/time
						$dataArray[$tgtCol] = undef if !($dataArray[$tgtCol] =~ /^(\d{2})[.\/]*(\d{2})[.\/]*(\d{2,4})/ or $dataArray[$tgtCol] =~ /^(\d{4})-(\d{2})-(\d{2})/ or $dataArray[$tgtCol] =~ /^(\d{2}):(\d{2}):(\d{2})/ or $dataArray[$tgtCol] =~ /^(\d{2}):(\d{2}):(\d{2})/ or $dataArray[$tgtCol] =~ /^(\d{2}):(\d{2})/);
						# convert DD./MM./YYYY hh:mm:ss to ODBC format YYYY-MM-DD hh:mm:ss
						$dataArray[$tgtCol] =~ s/^(\d{2})[.\/](\d{2})[.\/](\d{4}) (\d{2}):(\d{2}):(\d{2})/$3-$2-$1 $4:$5:$6/ if ($dataArray[$tgtCol] =~ /^(\d{2})[.\/](\d{2})[.\/](\d{4}) (\d{2}):(\d{2}):(\d{2})/);
						# convert YYYY-MM-DD hh:mm:ss.msec to ODBC format YYYY-MM-DD hh:mm:ss
						$dataArray[$tgtCol] =~ s/^(\d{2})[.\/](\d{2})[.\/](\d{4}) (\d{2}):(\d{2}):(\d{2})/$1-$2-$3 $4:$5:$6/ if ($dataArray[$tgtCol] =~ /^(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})\.\d{3}/);
						$dataArray[$tgtCol] =~ s/^(\d{4})(\d{2})(\d{2})(\d{2})(\d{2})(60)/$1-$2-$3 $4:$5:59/ if ($dataArray[$tgtCol] =~ /^(\d{4})(\d{2})(\d{2})(\d{2})(\d{2})(60)/); # sap doesn't pass correct time
						$dataArray[$tgtCol] =~ s/^(\d{4})(\d{2})(\d{2})(\d{2})(\d{2})(\d{2})/$1-$2-$3 $4:$5:$6/ if ($dataArray[$tgtCol] =~ /^(\d{4})(\d{2})(\d{2})(\d{2})(\d{2})(\d{2})/); # normal sap datetime
						$dataArray[$tgtCol] =~ s/^(\d{2})[.\/](\d{2})[.\/](\d{4})/$3-$2-$1 00:00:00/ if ($dataArray[$tgtCol] =~ /^(\d{2})[.\/](\d{2})[.\/](\d{4})/); # convert date values to ODBC canonical format YYYY-MM-DD 00:00:00 if no time part given
						if ($dataArray[$tgtCol] =~ /^\d{8}/) {
							$dataArray[$tgtCol] =~ s/^(\d{4})(\d{2})(\d{2})/$1-$2-$3 00:00:00/; # sap dates are yyyymmdd...
						}
						$dataArray[$tgtCol] =~ s/^(\d{4})\.(\d{2})\.(\d{2})/$1-$2-$3 00:00:00/ if ($dataArray[$tgtCol] =~ /^(\d{4})\.(\d{2})\.(\d{2})/); # date value yyyy.mm.dd
						# for date values with short year (2 digit)
						if ($dataArray[$tgtCol] =~ /^(\d{2})[.\/](\d{2})[.\/](\d{2})/) {
							my $prefix = "20";
							$prefix = "19" if $3 > $DB->{cutoffYr2000};
							$errorIndicator = "converting 2-digit year:".$3." into 4-digit year, prefix $prefix ; cutoff = ".$DB->{cutoffYr2000};
							$severity = 0 if !$severity;
							$dataArray[$tgtCol] =~ s/^(\d{2})[.\/](\d{2})[.\/](\d{2})/$prefix$3-$2-$1 00:00:00/;
						}
						$dataArray[$tgtCol] = undef if ($dataArray[$tgtCol] =~ /^00:00:00$/);
						$dataArray[$tgtCol] = undef if ($dataArray[$tgtCol] =~ /^0000-00-00 00:00:00$/);
						$dataArray[$tgtCol] =~ s/^(\d{2}):(\d{2}):(\d{2})/1900-01-01 $1:$2:$3/ if ($dataArray[$tgtCol] =~ /^(\d{2}):(\d{2}):(\d{2})/);
						$dataArray[$tgtCol] =~ s/^(\d{2})(\d{2})(\d{2})/1900-01-01 $1:$2:$3/ if ($dataArray[$tgtCol] =~ /^(\d{6})/);
						$dataArray[$tgtCol] =~ s/^(\d{2}):(\d{2})$/1900-01-01 $1:$2:00/ if ($dataArray[$tgtCol] =~ /^(\d{2}):(\d{2})$/);
						# consistency checks
						if ($dataArray[$tgtCol] =~ /^0/) {
							$errorIndicator .= "| wrong year value (starts with 0): ".$dataArray[$tgtCol].", field: ".$columns[$dbCol];
							$dataArray[$tgtCol] = undef;
							$severity = 1 if !$severity;
						}
						if ($dataArray[$tgtCol] && $dataArray[$tgtCol] !~ /^\d{4}\-\d{2}\-\d{2} \d{2}:\d{2}:\d{2}$/ && $dataArray[$tgtCol] !~ /^\d{4}\-\d{2}\-\d{2}$/) {
							$errorIndicator .= '| correct dateformat (\d{4}\-\d{2}\-\d{2} \d{2}:\d{2}:\d{2} or \d{4}\-\d{2}\-\d{2}) couldn\'t be created for: '.$dataArray[$tgtCol].", field: ".$columns[$dbCol];
							$dataArray[$tgtCol] = undef;
							$severity = 1 if !$severity;
						}
						$dataArray[$tgtCol] =~ s/(.*)/'$1'/ if $dataArray[$tgtCol]; # quote date/time values
					# everything else interpreted as string
					} else {
						if (length($dataArray[$tgtCol]) > $datasize) {
							$errorIndicator .= "| content '".$dataArray[$tgtCol]."' too long for field: ".$columns[$dbCol]." (type $datatype) in row $i (0-based), length: ".length($dataArray[$tgtCol]).", defined fieldsize: ".$datasize;
							$severity = 2;
						}
						$dataArray[$tgtCol] =~ s/'/''/g; # quote quotes
						$dataArray[$tgtCol] =~ s/\n//g; # remove newlines if existent (File{allowLinefeedInData}=1)
						$dataArray[$tgtCol] =~ s/(.*)/'$1'/ if $dataArray[$tgtCol]; # quote strings
					}

					# build insert/update statement
					my $colName = $columns[$dbCol]; 
					my $colVal = $dataArray[$tgtCol];
					$logger->trace("$colName: $colVal") if $logger->is_trace;
					# skip field building for incrementalStore and no content was found
					unless ($incrementalStore && !defined($data->[$i]{$columns[$dbCol]})) {
						# explicit NULL for empty values
						$colVal = "NULL" if !defined($dataArray[$tgtCol]) or $dataArray[$tgtCol] eq "";
						# fill primary key values with data from current row for update (in case insert fails)
						$updselector =~ s/$colName\s*=\s*\?/\[$colName\] = $colVal/ if ($updselector =~ /^$colName\s*=\s*\?/ || $updselector =~ /AND $colName\s*=\s*\?/i);
						# delete before select statement requires specific selector to only delete once for occurred data (first appearance of colVal)
						$deleteBeforeInsertSelector =~ s/$colName\s*=\s*\?/\[$colName\] = $colVal/ if ($deleteBeforeInsertSelector and ($deleteBeforeInsertSelector =~ /^$colName\s*=\s*\?/ || $deleteBeforeInsertSelector =~ /AND $colName\s*=\s*\?/));
						$updcols.="[".$colName."] = ".$colVal.",";
						$inscols.="[".$colName."],";
						$inscolVals.=$colVal.",";
						$tgtCol++;
					}
					$debugKey =~ s/$colName\s*=\s*\?/$colName = $colVal/ if ($debugKey =~ /$colName\s*=\s*\?/); # fill debug field display (for error messages)
				}
				# log collected errors during building of statement
				confess $errorIndicator.", at [".$debugKey."]" if $errorIndicator and $severity>=1;
				$logger->warn($errorIndicator.", at [".$debugKey."]") if $errorIndicator and $severity==0;
				# delete relevant data before insert. only done once for first row that fulfills $deleteBeforeInsertSelector
				if ($deleteBeforeInsertSelector && !$beforeInsert{$deleteBeforeInsertSelector}) {
					$logger->info("deleting data from $schemaName.$tableName, criteria: $deleteBeforeInsertSelector");
					my $dostring = "delete from $schemaName.$tableName WHERE $deleteBeforeInsertSelector";
					my $affectedRows = $dbh->do($dostring) or confess $DBI::errstr." with $dostring ".$debugKeyIndicator;
					$affectedRows =~ s/E0//;
					# mark deleteBeforeInsertSelector as executed for these data
					$beforeInsert{$deleteBeforeInsertSelector} = 1;
					$logger->info("entering data into $schemaName.$tableName after delete before insert, deleted rows: $affectedRows");
				}
				if ($logger->is_trace) {
					$logger->trace("data to be inserted:");
					$logger->trace($inscols);
					$logger->trace($inscolVals);
				}
				substr($inscols, -1) = ""; substr($inscolVals, -1) = ""; substr($updcols, -1) = ""; # remove last comma
				# only update before insert, if no deleteBeforeInsertSelector given (may not have a primkey then)
				if ($doUpdateBeforeInsert && !$deleteBeforeInsertSelector) {
					# insert data:  first try UPDATE
					my $dostring = "UPDATE $schemaName.$tableName SET $updcols WHERE $updselector";
					my $affectedRows = $dbh->do($dostring);
					if ($affectedRows == 0 or $DBI::errstr) {
						if ($affectedRows == 0 and $upsert) {
							my $dostring = "INSERT INTO $schemaName.$tableName ($inscols) VALUES (".$inscolVals.")";# ($placeholders)";
							$logger->trace("update failed (not yet existing), insert data instead: ".$dostring) if $logger->is_trace;
							# then try INSERT
							$dbh->do($dostring) or do {
								my $errRec;
								for (my $j=0; $j < scalar(@{columns}); $j++) {
									my $datatype = $coldefs->{$columns[$j]}{"TYPE_NAME"}."(".$coldefs->{$columns[$j]}{"COLUMN_SIZE"}.")";
									$errRec.= $columns[$j]."[".$datatype."]:".$dataArray[$j].", ";
								}
								confess $DBI::errstr." when inserting data: $errRec, executed statement: $dostring";
							}
						# error message not needed to suppress for update errors without upsert flag
						} else {
							my $errRec;
							for (my $j=0; $j < scalar(@{columns}); $j++) {
								my $datatype = $coldefs->{$columns[$j]}{"TYPE_NAME"}."(".$coldefs->{$columns[$j]}{"COLUMN_SIZE"}.")";
								$errRec.= $columns[$j]."[".$datatype."]:".$dataArray[$j].", ";
							}
							confess $DBI::errstr." when inserting data: $errRec, executed statement: $dostring";
						}
					};
				} else {
					# insert data:  first try INSERT
					my $dostring = "INSERT INTO $schemaName.$tableName ($inscols) VALUES (".$inscolVals.")";# ($placeholders)";
					$dbh->do($dostring) or do {
						$logger->trace("DBI Error:".$DBI::errstr) if $logger->is_trace;
						if ($DBI::errstr =~ /cannot insert duplicate key/i and $upsert) {
							my $dostring = "UPDATE $schemaName.$tableName SET $updcols WHERE $updselector";
							$logger->trace("insert failed (already existing), update date instead: ".$dostring) if $logger->is_trace;
							# insert data:  then try UPDATE
							$dbh->do($dostring) or do {
								my $errRec;
								for (my $j=0; $j < scalar(@{columns}); $j++) {
									my $datatype = $coldefs->{$columns[$j]}{"TYPE_NAME"}."(".$coldefs->{$columns[$j]}{"COLUMN_SIZE"}.")";
									$errRec.= $columns[$j]."[".$datatype."]:".$dataArray[$j].", ";
								}
								confess $DBI::errstr." when updating data: $errRec, executed statement: $dostring";
							}
						# error message if needed
						} elsif (($DBI::errstr =~ /cannot insert duplicate key/i and !$ignoreDuplicateErrs) or $DBI::errstr !~ /cannot insert duplicate key/i) {
							my $errRec;
							for (my $j=0; $j < scalar(@{columns}); $j++) {
								my $datatype = $coldefs->{$columns[$j]}{"TYPE_NAME"}."(".$coldefs->{$columns[$j]}{"COLUMN_SIZE"}.")";
								$errRec.= $columns[$j]."[".$datatype."]:".$dataArray[$j].", ";
							}
							confess $DBI::errstr." when updating data: $errRec, executed statement: $dostring";
						}
					};
				}
				print "EAI::DB::storeInDB stored ".($i+1)." of $lines\r" if $countPercent and (($i+1) % (int($lines * ($countPercent / 100)) == 0 ? 1 : int($lines * ($countPercent / 100))) == 0);
			}
		} else {
			confess "no data to store";
		}
	};
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("returned data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# delete data identified by key-data in database
sub deleteFromDB ($$) {
	my ($DB,$data) = @_;
	my $logger = get_logger();
	my $tableName = $DB->{tablename};
	my @keycolumns = @{$DB->{keyfields}} if $DB->{keyfields};
	eval {
		confess "no tablename given" if !$tableName;
		confess "no keyfields given" if !@keycolumns;
		confess "no valid dbh connection available" if !defined($dbh);
		if ((@{$data}) > 0) {
			# prepare statement
			my $whereclause; map {$whereclause = "[$_] = ? AND "} @keycolumns;
			substr($whereclause, -5)  = ""; # delete last " AND "
			my $sth = $dbh->prepare("DELETE FROM ".$tableName." WHERE $whereclause");
			# execute with data
			for my $primkey (@{$data}) {
				$logger->trace("deleting data for $primkey") if $logger->is_trace;
				$sth->execute(($primkey)) or confess "couldn't delete data for $primkey:".$DBI::errstr;
			}
		} else {
			$logger->error("no data to delete".longmess());
			return 0;
		}
	};
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("returned data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# update data in database
sub updateInDB ($$) {
	my ($DB,$data) = @_;
	my $logger = get_logger();
	my $tableName = $DB->{tablename};
	my @keycolumns = @{$DB->{keyfields}} if $DB->{keyfields};
	eval {
		confess "no tablename given" if !$tableName;
		confess "no keyfields given" if !@keycolumns;
		confess "no valid dbh connection available" if !defined($dbh);
		my $firstrecordID = (keys %{$data})[0];
		confess "no valid data passed (couldn't find keys in data hashes)" if !$firstrecordID;
		$logger->trace("passed data:\n".Dumper($data)) if $logger->is_trace;
		my @columns = sort keys %{$data->{$firstrecordID}}; # sort to ensure deterministic ordering of fieldnames !
		my $schemaName = $DB->{schemaName};
		if ($tableName =~ /\./) {
			$logger->debug("getting schema from $tableName (contains dot)");
			($schemaName, $tableName) = ($tableName =~ /(.*)\.(.*)/);
		}
		confess "no schemaName available (neither from tablename containing schema nor from parameter schemaName" if !$schemaName;
		my $colh = $dbh->column_info ('', $schemaName, $tableName, "%");
		my $coldefs = $colh->fetchall_hashref ("COLUMN_NAME");
		
		if ((keys %{$data}) > 0) {
			# prepare statement
			my %keycolumns; map {$keycolumns{$_}=1} @keycolumns;
			my $whereclause; map {$whereclause = "[$_] = ? AND "} @keycolumns;
			substr($whereclause, -5)  = ""; # delete last " AND "
			my @dataCols;
			my $cols; 
			# build columns for set statement and start ordered columns with non key fields (key fields are appended to this below in the order of the WHERE clause)
			map {if (!$keycolumns{$_}) {$cols.="[$_] = ?,"; push @dataCols, $_}} @columns;
			substr($cols, -1)  = ""; # delete last ","
			my $prepUpdStmt = "UPDATE ".$tableName." SET $cols WHERE $whereclause";
			$logger->trace("prepared update statement: $prepUpdStmt") if $logger->is_trace;
			my $sth = $dbh->prepare($prepUpdStmt);
			# execute with data from data columns and key columns
			for my $primkey (keys %{$data}) {
				my @dataArray;
				for (my $i=0; $i <= $#columns; $i++) {
					if ($i <= $#dataCols) {
						$dataArray[$i] = $data->{$primkey}{$dataCols[$i]};
					} else {
						$dataArray[$i] = $data->{$primkey}{$keycolumns[$i-$#dataCols-1]};
					}
				}
				$logger->trace("executed data: @dataArray ") if $logger->is_trace;
				$sth->execute(@dataArray) or do {
					my $errRec;
					for (my $j=0; $j < scalar(@{columns}); $j++) {
						my $datatype = $coldefs->{$columns[$j]}{"TYPE_NAME"}."(".$coldefs->{$columns[$j]}{"COLUMN_SIZE"}.")";
						$errRec.= $columns[$j]."[".$datatype."]:".$dataArray[$j].", ";
					}
					confess $DBI::errstr." with record: $errRec";
				}
			}
		} else {
			confess "no data to update";
		}
	};
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		$logger->trace("returned data:".Dumper($data)) if $logger->is_trace;
		return 1;
	}
}

# set handle with externally created DBI::db connection (if EAI::DB::newDBH capabilities are not sufficient)
sub setConn ($;$) {
	my ($handle,$setDSN) = shift;
	my $logger = get_logger();
	eval {
		confess "no DBI::db handle passed to setHandle, argument is '".(defined($handle) ? ref($handle) : "undefined")."'" unless $handle && blessed $handle && $handle->isa('DBI::db') ;
		$dbh = $handle;
		$DSN = $setDSN;
	};
	if ($@) {
		$logger->error($@);
		return 0;
	} else {
		return 1;
	}
}

# used to get the raw db handler, mainly for testability
sub getConn {
	return ($dbh, $DSN);
}

1;
__END__

=head1 NAME

EAI::DB - Database wrapper functions (for DBI / DBD::ODBC)

=head1 SYNOPSIS

 newDBH ($DB,$newDSN)
 beginWork ()
 commit ()
 rollback ()
 readFromDB ($DB, $data)
 readFromDBHash ($DB, $data)
 doInDB ($DB, $data)
 storeInDB ($DB, $data, $countPercent)
 deleteFromDB ($DB, $data)
 updateInDB ($DB, $data)
 setConn ($handle, $DSN)
 getConn ()

=head1 DESCRIPTION

EAI::DB contains all database related API-calls. This is for creating a database connection handle with newDBH, transaction handling (beginWork, commit, rollback), reading from the database (hash or array), doing arbitrary statements in the database, storing data in the database, deleting and updating data.

=head2 API

=over

=item newDBH ($$)

create a new handle for a database connection

 $DB .. hash with connection information like server, database
 $newDSN .. new DSN to be used for connection

returns 0 on error, 1 if OK (handle is stored internally for further usage)

=item beginWork

start transaction in database

returns 0 on error, 1 if OK

=item commit

commit transaction in database

returns 0 on error, 1 if OK

=item rollback

roll back transaction in database

returns 0 on error, 1 if OK

=item readFromDB ($$)

read data into array returned in $data

 $DB .. hash with information for the procedure, following keys:
 $DB->{query} .. query string
 $DB->{columnnames} .. optionally return fieldnames of the query here
 $data .. ref to array of hash values (as returned by fetchall_arrayref: $return[row_0based]->{"<fieldname>"}) for return values of query.

returns 0 on error, 1 if OK

=item readFromDBHash ($$)

read data into hash using column $DB->{keyfield} as the unique key for the hash (used for lookups), returned in $data

 $DB .. hash with information for the procedure, following keys:
 $DB->{query} .. query string
 $DB->{columnnames} .. optionally return fieldnames of the query here
 $DB->{keyfield} .. field contained in the query string that should be used as the hashkey for the hash values of $data.
 $data .. ref to hash of hash values (as returned by selectall_hashref: $return->{hashkey}->{"<fieldname>"}) for return values of query.

returns 0 on error, 1 if OK

=item doInDB ($;$)

do general statement $DB->{doString} in database using optional parameters passed in array ref $DB->{parameters}, optionally passing back values in $data

 $DB .. hash with information for the procedure, following keys:
 $DB->{doString} .. sql statement to be executed
 $DB->{parameters} .. optional: if there are placeholders defined in $DB->{doString} for parameters (?), then the values for these parameters are passed here.
 $data .. optional: ref to array for return values of statement in $DB->{doString} (usually stored procedure).

returns 0 on error, 1 if OK

=item storeInDB ($$;$)

store row-based data into database, using insert or an "upsert" technique

 $DB .. hash with information for the procedure, following keys:
 $DB->{tableName} .. table where data should be inserted/updated (can have a prepended schema, separated with ".")
 $DB->{addID} .. add an additional, constant ID-field to the data (ref to hash: {"NameOfIDField" => "valueOfIDField"}), only one field/value pair is possible here
 $DB->{upsert} .. update a record after an insert failed due to an already existing primary key (-> "upsert")
 $DB->{primkey} .. WHERE clause (e.g. primID1 = ? AND primID2 = ?) for building the update statements
 $DB->{ignoreDuplicateErrs} .. if  $DB->{upsert} was not set and duplicate errors with inserts should be ignored
 $DB->{deleteBeforeInsertSelector} .. WHERE clause (e.g. col1 = ? AND col2 = ?) for deleting existing data before storing: all data that fullfills the criteria of this clause for values in the first data record of the data to be stored are being deleted (following the assumption that these criteria are the fulfilled for all records to be deleted)
 $DB->{incrementalStore} .. if set, then undefined (NOT empty ("" !) but undef) values are not being set to NULL but skipped for the insert/update statement
 $DB->{doUpdateBeforeInsert} .. if set, then the update in "upserts" is done BEFORE the insert, this is important for tables with an identity primary key and the inserting criterion is a/are different field(s).
 $DB->{debugKeyIndicator} .. key debug string (e.g. Key1 = ? Key2 = ?) to build debugging key information for error messages.
 $data .. ref to array of hashes to be stored into database:
 $data = [
           {
             'field1Name' => 'DS1field1Value',
             'field2Name' => 'DS1field2Value',
             ...
           },
           {
             'field1Name' => 'DS2field1Value',
             'field2Name' => 'DS2field2Value',
             ...
           },
         ];
  $countPercent .. (optional) percentage of progress where indicator should be output (e.g. 10 for all 10% of progress). set to 0 to disable progress indicator

returns 0 on error, 1 if OK

=item deleteFromDB ($$)

delete data identified by key-data in database

 $DB .. hash with information for the procedure, following keys:
 $DB->{tableName} .. table where data should be deleted
 $DB->{keycol} .. a field name or a WHERE clause (e.g. primID1 = ? AND primID2 = ?) to find data that should be removed. A contained "?" specifies a WHERE clause that is simply used for a prepared statement.
 $data.. ref to hash of hash entries (as returned by selectall_hashref) having key values of records to be deleted

returns 0 on error, 1 if OK

=item updateInDB ($$)

update data in database

 $DB .. hash with information for the procedure, following keys:
 $DB->{tableName} .. table where data should be updated
 $DB->{keycol} .. a field name or a WHERE clause (e.g. primID1 = ? AND primID2 = ?) to find data that should be updated. A contained "?" specifies a WHERE clause that is simply used for a prepared statement.
 $data.. ref to hash of hash entries (as returned by selectall_hashref) having key values of records to be updated (keyval keys are artificial keys not being used for the update, they only uniquely identify the update records)
 $data = [ 'keyval1' => {
             'field1Name' => 'DS1field1Value',
             'field2Name' => 'DS1field2Value',
             ...
           }, 'keyval2' => {
             'field1Name' => 'DS2field1Value',
             'field2Name' => 'DS2field2Value',
             ...
           },
         ];

returns 0 on error, 1 if OK

=item setConn ($$)

set handle with externally created DBD::ODBC connection in case newDBH capabilities are not sufficient

 $handle .. ref to handle
 $setDSN .. DSN used in handle (used for calls to newDBH)
 
=item getConn

returns the DBI handler and the DSN string to allow direct commands with the handler. This can be used to enable DBI Tracing: (EAI::DB::getConn())[0]->trace(15);

=back

=head1 COPYRIGHT

Copyright (c) 2025 Roland Kapl

All rights reserved.  This program is free software; you can
redistribute it and/or modify it under the same terms as Perl itself.

The full text of the license can be found in the LICENSE file included
with this module.

=cut