include_once("common_lab_header.php");
Excerpt for Formatos en Base SAS Software como método de búsqueda by , available in its entirety at Smashwords


Formatos en Base SASR Software como método de búsqueda



Aplicaciones Reales




Miriam González Jaimes


Indice

Aplicaciones 32

Bibliografía 49

Conclusiones 48

Formatos como método de búsqueda 25

Formatos en SASR Software 4

Generación de variables a partir de un formato 22

Introducción 3

Opción CNTLIN 16

PROC FORMAT 11













Introducción


Gracias por adquirir esta publicación. Estás a punto de conocer los conceptos acerca de los formatos en SASR Software que van a permitir su aplicación como técnica avanzada de búsqueda.


Empezaremos con echar un vistazo a su uso tradicional; es decir, su aplicación para presentar los datos con una determinada forma tomando ventaja de los formatos ya disponibles en SASR Software; y cómo es que el usuario puede generar formatos propios de acuerdo a sus requerimientos.


Vamos a ver cómo los formatos de SASR Software pueden ser utilizados como un método de búsqueda eficiente y práctico que potencialmente puede reemplazar otros métodos de búsqueda convencionales como la sentencia merge y el método hash.


Nos daremos cuenta que los formatos como método de búsqueda pueden ser una técnica más eficiente en determinados escenarios, pues es posible obtener el valor de varias variables simulando cruces o sentencias merge en un solo paso data ¡y sin la ejecución de una sola sentencia merge!


Terminaremos con una serie de aplicaciones para poner en práctica los conceptos revisados y estudiar casos reales donde se utilizaron formatos como una solución eficiente y sencilla.


Un conocimiento básico de SASR Software y formatos es deseable, pues más allá de los conceptos teóricos, nos enfocaremos a la aplicación.





Formatos en SASR Software



Empecemos por recordar qué son los formatos y para qué sirven.


Supongamos que tenemos el data set EMPLEADOS con los registros de los pagos a los empleados de la compañía X.


Las variables o campos con los que contamos son:


  • Número de empleado (num_emp)

  • Sueldo de cada empleado (sueldo)

  • Fecha de pago (fecha_pago)




La fecha en la que se expidió el pago se trata de una fecha SAS, se encuentra en un formato que no es legible; y el monto del sueldo se podría presentar de otra manera, por ejemplo, colocando una coma para una mejor visualización de la cantidad.


Los formatos en SASR Software son precisamente la manera de presentar la información, sin que los valores originales cambien. En este caso, su aplicación sería de gran ayuda, sobre todo para interpretar la fecha de pago.


Existe una gran variedad de formatos: de tipo caracter, numéricos, fecha, hora. También se pueden generar formatos propios.


Para presentar valores en una forma específica se deberá elegir el formato adecuado, el cual depende del tipo de dato que se está manipulando. Recordemos que en SASR Software existen dos tipos de datos: numérico y caracter.


Las variables con valores de fecha y hora se consideran numéricos; sin embargo, existen formatos específicos para representar tales valores. De esa manera, disponemos de formatos de tipo numérico, caracter, fecha, hora; entre otros.


Para aplicar un formato se utiliza la instrucción FORMAT y se puede utilizar tanto en un paso DATA como en un paso PROC.



Sintaxis FORMAT.


FORMAT [nombre variable (s)] formato;


Donde:


nombre variable (s)

Lista de variables a las que se va a aplicar determinado formato.


formato

Formato predefinido o definido por el usuario a aplicar a las variables




Continuando con el ejemplo anterior; requerimos presentar el sueldo de los empleados con un formato 000,000.00 (un formato con comas). La fecha la vamos a visualizar con la forma DD/MM/AAA (día/mes/año, ejemplo 15/03/2017). Es importante mencionar que no vamos a alterar los datos originales, solo modificar la manera de presentar los datos.


Utilizaremos un procedimiento PRINT para mostrar los datos del data set EMPLEADOS con los nuevos formatos:



/* Muestra los datos del data set EMPLEADOS

aplicando los formatos solicitados */

proc print data=empleados;

format sueldo comma17.2;

format fecha_pago ddmmyy10.;

run;





Los datos se mostrarían como:





Veamos la diferencia más de cerca:


Datos originales Aplicando formatos




El data set original no ha cambiado, aunque ahora tenemos la fecha de pago en un formato legible.



Revisemos rápidamente algunos de los formatos disponibles en SASR Software y una breve descripción:




Caracter:


$UPCASEw.

Presenta los datos de tipo caracter en mayúsculas

$w.

Presenta los datos en caracter estándar



Fecha y hora (considerando que el valor a representar es una fecha SAS)


HHMMw.d

Presenta la hora en la forma hh:mm

MMDDYYw.

Presenta la fecha en la forma mm/dd/yy o mm/dd/yyyy, dependiendo del tamaño

YEARw

Presenta la fecha colocando el año únicamente



Numéricos

BINARYw.

Presenta los datos como binarios

COMMAw.d

Presenta valores numéricos con una coma cada tres dígitos y un punto para separar la parte decimal

DOLLARw.d

Presenta valores numéricos con un signo $, una coma cada tres dígitos y un punto para separar la parte decimal



La w indica el tamaño del valor que se va a representar; un tamaño menor impediría que se represente el dato completamente.

La d indica el tamaño con el que se va a representar la parte decimal del valor; por lo que solo se utiliza en formato de tipo numéricos.



Ejemplo:

En este ejercicio se puede observar nuevamente el efecto de la aplicación de los formatos en la presentación de los datos.


Datos sin formato:


data datos_crudos;

/* Datos originales sin formatos */

nombre_cliente = "Martin";

fecha_cita = '03mar2018'd;

hora_cita = '09:00't;

monto_prestamo = 256746;

run;


Tenemos registrada la cita con un cliente para cerrar el contrato de un préstamo; sin embargo, al mirar el reporte, nos encontramos con que no comprendemos ni la fecha ni la hora de la cita:




Es evidente que los datos se encuentran como fecha y hora SAS, así que no sería una buena idea compartir este reporte con el agente que va a gestionar el contrato (que además no tiene la menor idea de lo que es SAS).


Así que hagamos las cosas sencillas y escribamos unas cuantas instrucciones para hacer legible la información (sin cambiarla) para cualquier persona:



Datos con formato:


data datos_formato;

/* Datos originales sin formatos */

nombre_cliente = "Martin";

fecha_cita = '03mar2018'd;

hora_cita = '09:00't;

monto_prestamo = 256746;

/* Aplicamos formatos */

format nombre_cliente $upcase4.

fecha_cita mmddyy10.

hora_cita hhmm5.

monto_prestamo dollar5.2;

run;



Esta es nuestra salida:




¿Hay algo raro en los datos? Sí, el nombre del cliente y el monto del préstamo no se están presentando correctamente; o por lo menos, no están completos.


Esto sucede por el tamaño que estamos asignando al formato; no es suficiente para representar el dato completo.


Cabe mencionar que los datos originales no han cambiado; simplemente debemos indicar un tamaño correcto a los formatos.


Estas modificaciones serán suficientes para mostrar los datos como se requiere:


data datos_formato;

/* Datos originales sin formatos */

nombre_cliente = "Martin";

fecha_cita = '03mar2018'd;

hora_cita = '09:00't;

monto_prestamo = 256746;

/* Aplicamos formatos con un tamaño suficiente (es mayor)

para presentar el dato completo*/

format nombre_cliente $upcase10.

fecha_cita mmddyy10.

hora_cita hhmm5.

monto_prestamo dollar12.2;

run;



En esta ocasión, la salida es justo como la esperamos.






Purchase this book or download sample versions for your ebook reader.
(Pages 1-12 show above.)